خطاهای واژه ای 


روشهایی جهت بهبود کار اسکنر 
دیا گرام های انتقال 


زبانهای غیرمستقل از متن 
استفاده از دیاگرام cla‏ انتقال برای پیاده سازی پارسرهای پیشگو 


Follow و‎ First توابع‎ 


LL(1) گرامرهای‎ 


عنوان 
انواع تداخل در تجزیه انتقال — کاهش 
روش تجزیه تقدم — عملگر 
معایب روش پارس تقدم - عملگر 
نحوه یافتن روابط تقدم 
اصلاح خطا در روش تقدم - عملگر 


الگوریتم تجزیه LR‏ 

نحوه تهیه جدول SLR(1)‏ 

رسم دیا گرام انتقال SLR‏ 

دیا گرام های جدول تجزیه CLR‏ و LALR‏ 
طریقه رسم دیاگرام CLR‏ 

رسم دیاگرام و جدول تجزیه LALR‏ 


اصول طراحی و ساخت کامپابلرها 
1-١‏ تعریف کامپایلر: 
کامپایلر ( (Compiler‏ برنامه ای است که یک برنامه نوشته شده در یک زبان به نام 


زبان منبع ) (Source Language‏ را به ab,‏ ای معادل به زبانی دیگر به نام زبان 


AS ترجمه می‎ (Target Language ( مقصد‎ 


Source Program ——> ——> Target Program 


Error Messages 


۲-۱ مراحل کامپایل 
عملیات کامپایل در شش مرحله زیر صورت می گیرد : 

۱- تحلیل واژه ای ( Lexical Analysis‏ ) 

( Syntax Analysis ( تحلیل نحوی‎ -۲ 

(Semantic Analysis ( تحلیل معنایی‎ -۳ 
(Intermediate Code Generation ) تولید کد بینابینی‎ -F 
(Code Optimization ) سازی كد‎ ang -۵ 


۶- تولید کد نهایی ) (Code Generation‏ 


ارتباط بین این مراحل در شکل زیر نشان osla‏ شده است.در کنار شش مرحله اصلی 
کامپایلر دو بخش دیگر بنام خطاپرداز ( Error Handler‏ ) و جدول علائم ( 
(Symbol Table‏ نیز وجود دارد. 


Source Program 


Lexical Analysis 


ntax Analysis 


Sy 
4 Semantic Analysis 


Symbol-Table Error Handler 
Manager 


= Intermediate Code Generation 


Code Optimization 
Code Generation 


Target Program 


در مرحله اول کامپایل یعنی تحلیل واژه ای برنامه ورودی نویسه به نویسه خوانده شده و به 
دنباله ای از نشانه ها ( (Tokens‏ تبدیل می گردد.انواع مختلف نشانه ها عبارتند از : 
کلمات کلیدی ( Keywords‏ ) , عملگرها ( Operators‏ ) , جداکننده ها ( 
Delimeters‏ ( , ابت ها ( Literals‏ ( , شناسه ها Identifiers)‏ ) که به اسامی 
متغیرها و توابع و رویه ها و بطور کلی اسامی که کاربر انتخاب می کند گفته می شود.در 
اغلب زبانهای برنامه سازی کلمات کلیدی رزرو شده اند بدین معنی که کاربر مجاز نیست 
از هیچیک از آنها به عنوان اسم یک متغیر » تابع و يا رویه استفاده نماید.اما در برخی از 
زبانها مثل 1/1 این محدودیت وجود ندارد. 
در مرحله دوم برنامه از نظر خطاهای نحوی مورد بررسی قرار می گیرد و با استفاده از 
نشانه های تولید شده در مرحله تحلیل واژه ای یک درخت نحو Syntax Tree)‏ ( 
ایجاد می گردد. 
در مرحله سوم با استفاده از درخت نحو تولید شده در مرحله قبلی برنامه ورودی از نظر 
خطاهای مفهومی احتمالی بررسی می شود. 
در مرحله تولید کد بینابینی یک برنامه که معادل برنامه اصلی است با یک زبان بینابینی 
تولید می شود.با ایجاد این کد بینابینی عملیات بعدی که کامپایلر باید انجام دهد آسان می 
گردد.در انتخاب obj‏ بینابینی باید موارد زیر در نظر گرفته شوند : 

۱. تولید و بهینه سازی کد بینابینی باید ساده باشد. 

۲ ترجمه OT‏ به برنامه مقصد نیز به راحتی صورت پذیرد. 
در مرحله بهینه سازی کوشش می شود تا کد بینابینی تولید شده در مرحله قبلی به نحوی 
بهبود داده شود بطوریکه این کار مسبب تولید کدی می شود که از لحاظ اجرایی سریعتر 
می باشد. 


سرانجام در بخش تولید کد نهایی کد موردنظر بصورت برنامه مقصد تولید می 


شود.بعبارت دیگر هر کدام از کدهای بینابینی بهبود يافته به مجموعه ای از دستورات 


خطایر داز ( (Error Handler‏ 
هر بار که خطایی در یکی از dey‏ ها پیش Lh‏ رویه ای بنام خطاپرداز فراخوانده می 
شود. این بخش سعی می کند خطا را به نحوی برطرف کند که در نتیجه کامپایلر بتواند 
خطاهای بیشتری را در برنامه تشخیص دهد و با Gel‏ خطای موجود در برنامه عمل 
کامپایل متوقف نگردد.معمولا پارسر و اسکنر بیشتر خطاهایی را که در یک برنامه ممکن 

است و جود داشته باشد تشخیص می دهند. 

یکی از کارهای مهم و اساسی یک کامپایلر ثبت شناسه cla‏ استفاده شده در برنامه 
ورودی ( منبع ) و جمع آوری اطلاعات درباره مشخصات هر شناسه است.این مشخصات 
می توانند شامل : آدرس حافظه اختصاص osla‏ شده به شناسه , نوع OT‏ , محلی از برنامه 
که این شناسه در OT‏ تعریف شده است (SCOPE)‏ , و در رابطه با رویه ها اسم آنها , 
تعداد و نوع آرگومانهای آنها , روشی که به OT‏ طریق آرگومانها به رویه ها فرستاده می 
شوند.مثلا Call by Value & Call by Reference‏ و نوع نتیجه ای که رویه ها 
باز می گردانند باشد. 


در حدول نشانه ها به ازای هر شناسه ER‏ رکورد وجود دارد که این رکوردها شامل 


مشخصات شناسه ها می باشند.این جدول امکان دستیابی سریع به شناسه ها و مشخصات 
آنها را به ما می دهد.در کامپایلر و در مرحله تحلیل لغوی US‏ شناسه های موجود در 


برنامه اصلی وارد جدول نشانه ها می شوند.در مرحله cle‏ دیگر کامپایل این اطلاعات به 


جدول اضافه خواهند شد و سپس از آنها در موارد مختلف استفاده خواهد شد. 


۳-۱ ابتدا ( Front-End‏ ( و Back-End ( skäl‏ ) کامیایلر ها 
به چهار مرحله اول کامپ‌ایل و بخشی از مرحله بهینه سازی که بستگی به زبان منبع 
(source Program (‏ دارد و مستقل از ماشین Front-End cul‏ کامپایلر گویند.به 
Back-End‏ کامپایلر می گویند.معمولا این بخش از کامپایلر وابسته به زبان منبع 
نیست.شکل بعد ترجمه دستور 1۳1*60-<:0 و SU‏ هر مرحله از کامپایلر بر روی این 


دستور را نشان می دهد.( ۲ , 0 , 1همگی از نوع real‏ هستند) 


Lexical Analyzer 


101 := id2 + id3 * 60 


Syntax Analyzer 


Semantic Analyzer 


VAN 


13 inttoreal 


Intermediate Code Generation 


tl := inttoreal(60) 
t2 :< 103 * tl 
t3 := 102 + t2 
idl := t3 


| 


Code Optimizer 


tl := id3 * 60.0 
idl :=id2+tl 


movF id3,R2 
mulF #60.0,R2 


movF 2,1 
ADDF R2,R1 
movF 1,1 


( Lexical Analysis ) تحلیل واژه ای‎ -f 
نخستین مرحله کامپایل تحلیل واژه ای است.به واحدی از کامپایلر که کار تحلیل واژه ای‎ 
می گویند.اسکنر بین رشته ورودی و تحلیلگر‎ (Scanner) را انجام می دهد اسکنر‎ 
اسکنر این است که با خواندن‎ hel واقع است.وظیفه‎ ) Parser ( نحوی یا پارسر‎ 
کارا کترهای ورودی , توکن ها را تشخیص داده و برای پارسر ارسال نماید.رابطه اسکنر و‎ 


پارسر بصورت زیر است : 


Read character Pass Token & 
Attribute 


Input Scanner Parser «< 
شش‎ <= 


Put Back Get next 
Character Token 


Symbol 
Table 


به عنوان مثال در صورتی که رشته ورودی € ۳ 8 <: ۸ باشد توکن های زیر تشخیص 


داده خواهند شك 


آدرس ٤‏ , 10 >و > <add. Op.‏ < آدرس 8 , 10 > و > Op.‏ .295 > و < آدرس A‏ ,10 > 
بنابراین اسکنر علاوه بر این که تشخیص می دهد که توکن یک شناسه است آدرس OT‏ 
در جدول نشانه ها را نیز برای پارسر می فرستد.علاوه بر این اسکنر می تواند محل های 
Je‏ و توضیحات ) (Comments‏ موجود در برنامه اصلی را ضمن خواندن برنامه 
حذف نماید. 

به آخرین توکنی که اسکنر یافته است علامت پیش بینی ( (Lookahead Symbol‏ و 


oS gk‏ جاری گفته می شود. 


۱-۳ الگو Pattern)‏ ) و واژه (Lexeme)‏ ت وکن ها 
به فرم کلی که یک توکن می تواند داشته باشد الگوی OT‏ توکن می گویند.به عبارت 


oO ما‎ ۰ ۰ ۰ a S|} 
وجود دارند که توکن یکسانی برای انها تشخیص داده می‎ ole دیکر در ورودی رشته‎ 


شود .فرم IS‏ این رشته ها توسط الگوی OT‏ ت وکن توصیف می شود. 
به دنباله ای از نویسه ها که تشکیل یک توکن می دهند واژه ( OT (Lexeme‏ ت وکن می 


a 7 ۰ ۰‏ ۳ 
گویند.جدول زیر حاوی چند نمونه الگو و واژه است : 


Token Lexeme Pattern 


Const Const Const 


if if if 


relation <,>,<=,>=,<,=/<or>or<=or>=or< 
or = 
id pi با حروف الفبا شروع و بدنبال آن‎ 


حرف و رقم قرار می گیرد 


هر ثابت عددی 3.1416 Num‏ 


هر رشته نویسه ای که بین دو literal "core dumped"‏ 


علامت " قرار گیرد 


در بعضی وضعیت ها اسکنر قبل از اینکه تصمیم بگیرد چه تو کنی را به پارسر بفرستد ناز 
دارد که چند کارا کتر دیگر نیز از ورودی بخواند.بعنوان مغال اسکتر با دیدن علامت ۲ < ۱ 


در ورودی GLE‏ دارد که کاراکتر ورودی بعدی را نیز بخواند در صورتی که این کاراکتر = 


باشد ت وکن ' =< "و در غیر اینصورت توکن " < ' تشخیص داده می شود.در مورد آخر 
باید کاراکتر اضافی خوانده شده دوباره به ورودی با زگردانده شود. 

یکی دیگر از مشکلاتی که اسکنر OTL‏ روبرو است در زبانهایی نظیر Fortran‏ است.در 
این قبیل زبانها محل خالی (Blank)‏ بجز در رشته های کاراکتری نادیده گرفته می 
شود.به عنوان مثال کلمه DO‏ در فرترن در دستور زیر را در نظر بگیرید : 

Do 5 1 <- 5‏ تا زمانی که به نقطه اعشار در 1.25 نرسیده باشیم نمی توان گفت که 


Do‏ در این دستور کلمه کلیدی نیست بلکه بخشی از متغیر DOSI‏ است.به همین ترتیب 
در دستور 25 , 1 =1 5 Do‏ تا زمانی که LIS Core‏ دیده نشود نمی توان گفت که 
این ES‏ حلقه DO‏ است. 
در زبانهایی که در آنها کلمات کلیدی ( Keyword‏ ) جزو کلمات رزرو شده نیستند 
نظیر 1/1 اسکنر نمی تواند کلمات کلیدی را از شناسه cle‏ همنام آنها تشخیص دهد.به 
عنوان مثال در دستور زیر : 

IF Then THEN Then = Else; ELSE Else = Then :‏ 
جدا کردن کلمه کلیدی THEN‏ از متغیر Then‏ بسیار مشکل است.در این موارد معمولا 


پارسر تشخیص نهایی را خواهد داد. 


۲-۲ خطاهای واژه ای ( Lexical Errors‏ ( 
بطور IS‏ خطاهای محدودی را اسکنر می تواند ble‏ زیرا اسکنر تمام برنامه ورودی را 
یکجا نمی بیند بلکه هر بار قسمت کوچکی از برنامه منبع را می بیند.بعنوان مثال هرگاه 
رشته fi‏ در یک C ab,‏ برای بار اول مشاهده شود اسکنر قادر نیست تشخیص دهد که 
LT‏ 11 یک املای غلط از کلمه کلیدی ]1 است با یک متغیر. 

fi(x = = f(x)) 


از آنجایی که 11 یک متغیر مجاز است اسکنر این ت وکن را به عنوان یک شناسه به پارسر 


Handler‏ ( فراخوانده می شود تا آن خطا را به نحوی برطرف کند.روشهای مختلفی 
برای اینکار وجود دارد که ساده ترین WT‏ روشی موسوم به " Panic Mode‏ " 
است.در این روش آنقدر از رشته ورودی حذف می شود تا اينکه یک توکن درست 
تشخیص داده شود. 
سایر روشهای تصحیح خطا ) Le (Error-Recovery‏ تند از : 

۱- حذف یک کاراکتر غیرمجاز ( تبدیل =5: به <:) 

) :< وارد کردن یک کاراکتر گم شده ( تبدیل : به‎ -Y 

۳- تعویض کردن یک کاراکتر غلط با یک کاراکتر درست ( تبدیل :: به CS‏ 


bale -۴‏ کردن دو کاراکتر مجاز ( تبدیل := به <: ) 


۲-۳۲ روشهایی جهت بهبود کار اسکنر 

۱-۳-۲ استفاده از بافر 

در بسیاری از زبانها اسکنر برای تشخیص نهایی توکن ها و مطابقت دادن OT‏ با الگوهای 
موجود نیاز دارد که چند کاراکتر جلوتر را نیز مورد بررسی قرار دهد.از آنجایی که مقدار 
زیادی از زمان در جابجایی کاراکترها سپری می شود از تکنیکك های بافرینگ برای 
پردازش کارا کترهای ورودی استفاده می گردد. 

در یکی از این SUS‏ ها از یک بافر که به دو نیمه N‏ کاراکتری تقسیم شده است 
استفاده می کنند که در N oT‏ تعداد کاراکترهایی است که در روی یک بلوک از 
Sus‏ جای می گیرند.به این ترتیب با یک فرمان read‏ بجای خواندن یک کاراکتر می 
توان N‏ کاراکتر ورودی را در هر نیمه بافر وارد کرد.درصورتیکه ورودی شامل تعداد 
کاراکترهای کمتر از N‏ باشد بعد از خواندن این کاراکترها یک کاراکتر خاص ]60 نیز 


وارد ab‏ می گردد. کارا کتر 607 بیانگر پایان فایل منبع بوده و با سایر کاراکترهای ورودی 


به نوعی تفاوت دارد. 


Forward 


Lexeme-Beginning 


درمافز ورودی از دو نغانه رو استفاده کی کرد ر که کارا کتری ن این دو GLAS‏ رو هعرف 
Lexeme‏ جاری می باشد.در ابتدا هر دو نشانه رو به اولین کاراکتر Lexeme‏ بعدی که 
باید پیدا شود اشاره می کنند.نشانه روی Forward‏ پیش می رود تا اینکه یک § OS‏ 
تشخیص داده شود. 

این نحوه استفاده از بافر در بیشتر موارد کاملا خوب عمل می کند.با این وجود در مواردی 
که جهت تشخیص یک توکن , نشانه رو Forward‏ ناچار Cul‏ بیشتر از طول Bl‏ جلو 
برود این روش کار نمی کند.به . عنوان مال دستور 
DECLARE (ARGI,ARG2,...,ARGn)‏ را در یک برنامه PL/I‏ در نظر 


بگیرید.در این دستور تا زمانی که کاراکتر بعد از پرانتز سمت راست را بررسی نکنیم نمی 
توان گفت که DECLARE‏ یک کلمه کلیدی است و یا یک اسم آرایه. 


برای کنترل > oS‏ نشانه روی Forward‏ و همچنین کنترل بافر می توان بصورت زیر 


عمل کرد : 
If | Forward is at end of first half Then begin‏ 
reload Second-half ;‏ 
Forward := Forward + 1 ;‏ 
end‏ 
در این قسمت اگر نشانه روی Forward‏ به انتهای نیمه اول بافر رسید , نیمه دوم با N‏ 
کاراکتر جدید پر خواهد شد . 


elseif Forward is at end of second-half Then begin 
reload first-half ; 
move Forward to beginning of first-half 

end 

else Forward := Forward + 1 ; 

در صورتیکه slis‏ روی Forward‏ به انتهای نیمه دوم بافر برسد نیمه اول بافر را با N‏ 


کاراکتر جدید پر می کنیم و نشانه روی Forward‏ را به آغاز Set pl‏ می کنیم. 


۲-۲-۲ استفاده از نگهبانها ( (Sentinels‏ 

در حالت قبل با جلورفتن نشانه روی Ub Forward‏ چک می شد که bT‏ این نشانه رو به 
انتهای یک نیمه از بافر رسیده است یا خير .در صورتیکه به انتهای یک نیمه Bl‏ رسیده 
باشد باید نیمه دیگر را دوباره بار می کردیم.در الگوریتم فوق همان طوریکه مشاهده شد 
برای هر جلوروی شانه روی Forward‏ دو عمل du lie‏ انجام می شود.می توان این دو 
را به یک بار تست تبدیل کرد.برای این کار باید در انتهای هر نیمه بافر یک کاراکتر 


نگهبان قرار دهیم ( Sentinel‏ به عنوان قسمتی از برنامه منبع نخواهد بود ) 


به این ترتیب برای کنترل > cS‏ نشانه روی Forward‏ می توانیم از الگوریتم زیر 


استفاده کنیم : 


Forward := Forward + 1 ; 
if Forward = eof Then begin 
if Forward is at end of first-half Then begin 
reload second-half ; 
Forward := Forward + 1 
end 
else if Forward is at end of second-half Then begin 
reload first-half ; 
move Forward to beginning of first-half 
end 
else 
/* eof within a buffer signifying end of input */ 
Terminate Lexical Analysis 
end. 


۴-۲ دیاگرام های انتقال 

برای پیاده سازی دستی یک اسکنر از ابزاری بنام دیاگرام انتقال ۱ Transition‏ 
Diagram‏ کمک می گیریم.یک دیاگرام انتقال در واقع یک گراف جهت دار است 
که هریک از گره های OT‏ معرف یک وضعیت ( (State‏ است.یکی از وضعیت ها بعنوان 
وضعیت شروع و یکی ( یا چند تا ) از آنها بعنوان وضعیت ( های ) خاتمه مشخص می 
گردد.برچسب ) (Label‏ هایی روی لبه cle‏ یک دیا گرام انتقال قرار داده می شود که 
مشخص می AS‏ در چه صورتی می توان از یک وضعیت به وضعیت Ko‏ رفت.هر 
دیاگرام انتقال معرف یک زبان است.با خواندن کاراکترهای یک رشته تطبیق آنها با 


برچسب های دیا گرام انتقال معرف یک Obj‏ و پیمایش OT‏ دیاگرام می توان مشخص 
نمود که LT‏ آن رشته متعلق به زبان موردنظر است يا خیر.به عنوان مثال دیا گرام انتقال زیر 
و عبارت منظم (alb)* abb‏ هر دو زبانی را توصیف می کنند که شامل aby‏ های 


تشکیل شده از علائم ۳ و " 9" که به زیررشته " 200 " ختم می شوند است. 


نج( ”7 


دیا گرام فوق یک دیا گرام غیر قطعی ( (NonDeterministic‏ است.یک دیا گرام انتقال 
غیر قطعی دیا گرامی است که یکی از دو خاصیت زیر را داشته باشد : 
e‏ لبه های خارج شده از برخی از وضعیت OT cle‏ برچسب مشابه داشته باشند. 
۵ لبه های دارای برچسب € وجود داشته باشد ( برچسب € به pl‏ معنی است که 
بدون توجه به ورودی می توانیم از یک وضعیت به وضعیتی دیگر برویم ) 
" 


دیا گرام فوق غیر قطعی است زیرا از وضعیت SO‏ دو لبه با برچسب مشت رک " ۵ " خارج 


شده است. 

درصورتیکه دیاگرامی غیرقطعی نباشد آنرا قطعی ( (Deterministic‏ گویند.همچنین 
هر دیاگرام غیرقطعی را می توان به یک دیاگرام قطعی معادل تبدیل کرد.مثلا دیاگرام زیر 
معادل فوق لیکن قطعی است : 


a a 


E ON 
ee eee 


برنامه ای که از یک دیا گرام قطعی استفاده می AS‏ پیاده سازی راحت تری نسبت به برنامه 
مبتنی بر یک دیاگرام غیرقطعی دارد.برنامه مبتنی بر یک دیاگرام غیرقطعی بایستی دارای 
قابلیت پی جویی یا Backtracking‏ باشد.از طرف دیگر دیاگرام cle‏ انتقال قطعی 
معمولا تعداد وضعیت بیشتری نسبت به دیاگرام غیرقطعی معادل خود دارند. بنابراین برای 
پیاده سازی یک اسکنر ابتدا دیاگرام های انتقال معرف الگوی توکن های زبان موردنظر 
رسم می گردد.این دیاگرام ها برای بدست آوردن اطلاعات در مورد کاراکترهایی که 
بوسیله alis‏ روی Forward‏ در ورودی obs LL‏ شوند استفاده می گردد.به این ترتیب 


که همانطور که کاراکترهای ورودی خوانده می شوند از یک وضعیت در دیاگرام به 


وضعیتی دیگر حرکت می کنیم تا اینکه به یک وضعیت نهایی برسیم.پیمایش دیاگرام از 


وضعیت شروع Start)‏ ) آغاز می شود. 


a c 


( AL V 
Start 5۹ 
هلت نهلی و‎ 


b 


هنگامیکه در وضعیت فعلی لبه ای که برچسب OT‏ مساوی کاراکتر ورودی است قرار 
داشته باشیم از آن حالت بوسیله آن لبه به حالت بعدی می رویم و در pF‏ اینصورت 
ت وکن توسط این دیا گرام قابل تشخیص نخواهد بود. 

برچسب " other‏ " در روی لبه یک وضعیت بیانگر هر کاراکتری است که توسط لبه 
cle‏ دیگر OT‏ وضعیت ذ کر نشده اند. 


مثال- دیا گرام تشخیص توکن P="‏ بصورت زیر است : 
= > 
o‏ 
> — 
other‏ 


6۲ یعنی هر کاراکتر دیگر غیر از = 


علامت * یعنی اینکه بایستی آخرین ورودی به بافر باز گردد. 
درصورتی که در کلیه دیا گرام ها نتوان یک توکن را تشخیص داد یک خطای واژه ای 


روی داده است و LL‏ برنامه jlo ples‏ فراخوانی شود. 


مثال - دیا گرام تشخیص شناسه obj cle‏ پاسکال 


letter other 


Letter / digit 


با توجه به اينکه کلمات کلیدی از یکت دنباله کارا کتری تشکیل شده اند لذا می توان از 


دیاگرام فوق برای تشخیص کلمات کلیدی نیز استفاده نمود.تشخیص DLS‏ کلیدی 


و شناسه ها توسط یک دیاگرام باعث کاهش تعداد وضعیت های دیاگرام انتقال اسکنر 
فی گردد.برای آنکه کلمات کلیدی را از شناسه های همنامشان جدا سازیم یکی از ساده 
ترین روشها این است که در ابتدا در جدول نشانه ها کلمات کلیدی را وارد کنیم.به این 
ترتیب با رجوع به جدول نشانه ها می توان دریافت که توکن مورد نظر شناسه است يا 
کلمه کلیدی. 

K‏ 1 جدول 


نشانه ها 


Keyword Su >‏ بودن می باشد 


برای این کار از دو تابع ( gettoken(‏ و ( install-id(‏ استفاده می شود.تابع install-‏ 
( )10 جدول علائم را جستجو می AS‏ و اگر واژه توکن در جدول نشانه ها بعنوان کلمه 
کلیدی آمده باشد این تابع ote‏ صفر را بازمی گرداند.در صورتی که واژه یک متغیر 
تشخیص داده شود و در جدول هم موجود باشد این تابع آدرس OT‏ متغیر در جدول نشانه 
ها را بوسیله یک اشاره گر باز می گرداند.ا گر چنانچه واژه در جدول موجود نباشد بعنوان 


ورودی جدید به جدول علائم وارد شده و مطابق حالت قبل آدرس OT‏ با ز گردانده خواهد 


شد. 
gettoken( )‏ نیز بطور مشابهی جدول نشانه ها را جستجو کرده و در صورتی که واژه 
موردنظر یک کلمه کلیدی باشد ت وکن متناظرش را مستقیما به پارسر می فرستد و در غير 


اینصورت توکن " 14 " را انتقال می دهد.به این ترتیب در صورتی که تعداد کلمات 


کلیدی تغییر کند دیا گرام انتقال بدون تغییر باقی خواهد ماند و به راحتی می توان این تغییر 
را در جدول نشانه ها slew!‏ کرد. 

در leu!‏ ذکر چند نکته در مورد نحوه قرار دادن دیا گرام انتقال توکن های مختلف 
ضروری است.اول آنکه اسکنر AL‏ همواره سعی AS‏ طولانی ترین ت وکن ممکن را 
تشخیص دهد.مثلا دیا گرام تشخیص اعداد اعشاری بایستی قبل از دیاگرامی باشد که اعداد 
صحیح را تشخیص می دهد.همچنین دیاگرام تشخیص توکن هایی که مورد استفاده 
پیشتری در برنامه ها دارند ( مثلا LL )..., tab , space‏ قبل از دیاگرام انتقال ت وکن های 
کمیاب تر قرار گیرد تا در نهایت تست کمتری برای تشخیص توکن ها انجام شود.مثلا 
رتيب oo se‏ ها برای تشخیص اعداد را نشان می دهد.شماره 


digit 


digit digit 
ıı >> ول‎ 


digit 
digit digit other 


0( سوت 


digit 


digit 7 other 


۳ © 


بعد از اينکه دیا گرام تشخیص توکن ها رسم شد به راحتی می توان آنرا با دستور Case‏ 
پیاده سازی نمود. 
هر دیا گرام انتقال غیرقطعی را می توان به یک گرامر مستقل از متن / منظم تبدیل کرد.برای 
اینکار Lb‏ مراحل زیر را انجام داد : 
۱. به ازای هر حالت ا یک غیرپایانه Aj‏ در نظر می گیریم. 
۲ اگر از حالت 1با ورودی 0 به حالت [می رویم قاعده ای بصورت ز0۸ Ai‏ 
تولید می کنیم. 
اگر از حالت 1با ورودی € به حالت oJ‏ رویم قاعده ای به فرم Aj Aj‏ تولید 
ین ees‏ 


. اگر یک حالت نهایی باشد قاعده ای به فرم Ai E‏ تولید می کنیم. 


. اگر 1 حالت شروع باشد غیرپایانه Aj‏ را به عنوان علامت شروع گرامر در نظر می 


Ao ج‎ aA, | aA) 0۸0 
A, > bA» 

A» > bA; 

A3 —> € 


اگرچه می توان قواعد لغوی زبانها را توسط گرامرهای مستقل از متن نیز بیان نمود لیکن 
دلایلی وجود دارد که بهتر است قواعد لغوی توسط عبارات منظم توصیف شوند : 
۱ قواعد لغوی زبانها اغلب Le‏ ساده هستند و برای توصیف آنها نیازی به AL‏ 
. عبارات منظم بطور کلی وسیله ای فشرده تر و گویاتر از گرامرهای مستقل از متن 
هستندك. 
. اسکنرهای سریعتری را می توان بصورت خود کار از روی عبارات منظم تولید 


کرد. 


۴ جداکردن ساختار دستوری یک زبان به دو بخش لغوی و غیرلغوی کار پیاده 
سازی قسمت Front-End‏ کامپایلرها بصورت پیمانه ای را راحت تر می سازد. 


۳ - تحلیل نحوی ) (Syntax Analysis‏ 
در مرحله تحلیل نحوی برنامه ورودی از نظر دستوری بررسی می شود.تحلیلگر نحوی با 
پارسر برنامه ورودی را که بصورت دنباله ای از ت وکن ها است از اسکنر گرفته و تعیین می 

کند که bT‏ این جمله می تواند بوسیله گرامر زبان موردنظر تولید شود یا خیر ؟ 


رابطه پارسر و اسکنر بصورت زیر است : 


Source Lexical 
Program Analyzer 


get next token 


Symbol-Table 


بطور کلی دو نوع روش تحلیل نحوی وجود دارد : 
۱- روشهای بالا به پائین ) (Top-Down‏ 
۲ - روشهای پائین به بالا ( (Bottom-Up‏ 


روشهای بالا به پائین , درخت تجزیه ( (Parse Tree‏ را از بالا به پائین می سازند در 
SUE‏ روشهای پائین به بالا برعکس عمل می کنند یعنی درخت تجزیه را از پائین به بالا 
تولید می کنند.در هر دو روش ورودی از چپ به راست و در هر قدم فقط یک توکن 
بررسی می شود. 
به عنوان مثال گرامر زیر را در نظر بگیرید. 
IES EETIT‏ 
۲ - ۲ 34 
F—(E) 0‏ 5,6 
درخحت jou‏ 4 جمله 10 + id‏ بصورت زیر خواهد بود که در OT‏ ريشه درخت علامت 


شروع گرامر است.( توضیح اینکه از این پس اگر علامت شروع گرامری بصورت صریح 


مشخص نشود غیرپایانه سمت چپ اولین قاعده گرامر بعنوان علامت شروع OT‏ در نظر 


مهمترین روشهای تجزیه بالا به پائین عبارتند از : 
۱ - روش پائینگرد ( (Recursive Descent‏ 


خوانده اه وتو فد کر هو با دوم یعنی پارسر از بسط چپ Left-Most-)‏ 
0 استفاده می کند و " 1" نیز بیانگر این است که در هر قدم از تجزیه فقط 


مهمترین روشهای تجزبه پائین به بالا عبارتند از : 
| - روش تقدم عملگر ( (Operator Precedence‏ 


(Simple Precedence ) روش تقدم ساده‎ - Y 
, LALR(1) , SLR(1) که خود دارای سه فرم مختلف با نامهای‎ LR(1) روش‎ - ۳ 
است.‎ CLR(1) 


تمامی روشهای فوق به نوعی از یک روش کلی به نام انتقال - کاهش ( Shift-‏ 
S32 (Reduce‏ می کنند.اگر چه روشهای تجزیه بالا به پائین برای erly‏ سازی دستی 
مناسب ترند اما ابزارهایی وجود دارد که با کمک آنها می توان بطور خود کار پارسرهای 
قوی پائین به بالا تولید نمود.در LRO)‏ منظور از L'‏ یعنی پارسر ورودی را از چپ به 
راست می خواند و منظور از " 15 " این است که پارسر از عکس بسط راست ) Right-‏ 
Most-Derivation‏ ) استفاده می AS‏ 


۱-۳ تجزبه Yb‏ به Top-Down Parsing ( ob‏ ) 
در Se‏ کلی یک پارسر بالا به پائین بایستی بتواند در صورت لزوم عمل پیجوئی 
(Back Tracking (‏ انجام دهد. گرامر زیر را در نظر بگیرید. 


S — 0 
A— 20 | 


برای تجزیه رشته ورودی Cad‏ پارسر بصورت زیر عمل می کند : 


چون 4 با D‏ برابر نیست پارسر نیاز دارد که یک مرحله به عقب jb‏ گردد و قاعده دیگر را 


مورد بررسی قرار دهد. 


JAN 


c d 


/ 


a 


در اینجا پارسر نتبجه می گیرد که رشته ورودی رشته قابل قبول در گرامر می باشد. 

اگرچه همانگونه که توضیح داده شد عمل نحوی در حالت کلی می تواند به روش 
آزمایش و خطا اجرا گردد لیکن بهتر است پارسرها بگونه ای طراحی و oale‏ سازی شوند 
که نیازی به پیجوئی نداشته باشند.به پارسرهایی که عمل عقبگرد انجام نمی دهند پارسر 
(Predictive) 5.‏ ند از.طترفتی باوسن‌ها معتمولا به ضورت تفر بضاله ی 
greedy (‏ ( عمل می کنند یعنی با دریافت هر توکن درخت تجزیه را تا حد امکان 
گسترش می دهند و تنها هنگامی که دیگر امکان گسترش درخت پارس وجود نداشته 


به عنوان مثال گرامر زیر را که معرف گونه ( (Type‏ در زبان پاسکال است در نظر 


بگیرید. 
Type — Simple‏ 
T id‏ | 
array [ Simple | of Type‏ | 
Simple — integer‏ 
char‏ | 
num dot dot num‏ | 


در روشهای بالا به پائین تولید درخت تجزیه از ريشه درخت که همان غیرپایانه شروع 
گرامر است SET‏ و در ادامه کار مراحل زیر بطور مکرر انجام می گیرد و درخت تجزیه 
بصورت بالا به پائین و از چپ به راست ساخته می شود : 
۱ در گره 1 با غیرپایانه A‏ یکی از قواعد گرامر که ۸ در سمت چپ OT‏ 
قرار دارد را انتخاب کرده و سمت راست این قاعده را بعنوان فرزندان گره 
1 در درخت پارس قرار می دهد. 
۲ گره بعدی را که از آنجا یک زیردرخت دیگر BL‏ ایجاد شود را پیدا می 
کند. 


مراحل فوق در Ge‏ آنکه رشته ورودی از چپ به راست خوانده می شود انجام می 


" 


array | num dot dot num ] of integer " رشته ورودی بصورت‎ 


باشد.مراحل تشکیل درخت پارس بصورت زیر خواهد بود : 


ورودی 


array [ num dot dot num | of integer 


array [ num dot dot num | of integer 


4 


array | num dot dot num ] of integer 


A 


معمولا انتخاب یک قاعده برای یک غیرپایانه بصورت سعی و خطا ) Trial-and-‏ 
Error‏ ( انجام می شود.بدین معنی که در صورتی که قاعده انتخایی اول مناسب ادامه 


عمل تجزیه نباشد با عمل عقبگرد یا پیجوئی قاعده دیگری انتخاب می گردد. 


۲-۳ تجزبه پائینگره ( (Recursive Descent Parsing‏ 
یکی از انواع پارسرها که بصورت پیشگویانه عمل می کند پارسر پائینگرد ( Recursive‏ 
Descent‏ است.اين پارسر بصورت بالا به پائین عمل می کند و در OT‏ یک مجموعه 
رویه ها بطور با زگشتی رشته ورودی را مورد پردازش قرار می دهند.این رویه ها که برای 
پردازش رشته ورودی فراخوانی می شوند یک درخت پارس برای ورودی ایجاد می 
کنند.یک پارسر پائینگرد به ازای هر غیرپایانه یک رویه دارد که دو کار انجام می دهد : 
۱- تصمیم می گیرد که از کدام قاعده گرامر استفاده شود. 
۲- از قاعده انتخاب شده استفاده هی کند. 
علاوه بر ay)‏ هایی که به ازای هر غیرپایانه وجود دارد یک پارسر پائینگرد از رویه 
دیگری بنام match‏ برای تطبیق توکن Gl‏ ورودی و پایانه های درخت تجزیه در حال 
ساخت استفاده می کند.بعنوان مثال پارسر پائینگرد برای گرامر تعریف Type‏ در obj‏ 
پاسکال دو رویه برای غیریایانه های Type‏ و Simple‏ خواهد داشت.رویه match‏ نیز 
بصورت زیر است : 


Procedure match (t: token (+ 
begin 


if Lookahead=t Then 
Lookahead := nexttoken 

else Error 

end 


رویه فوق برای راحتی کار رویه Type ck‏ و Simple‏ استفاده می شود و متغیر 
0 را تغییر می دهد. 


Procedure Type; 
begin 
if Lookahead is in {integer,charnum} Then Simple 
else if Lookahead = array then begin 
match ( array ) ; 
match ('['); 
Simple ; 
match (']'); 
match (of) ; 
Type 
end 
else if Lookahead ='f' Then Begin 
match ('*t'); 
match(' id ' ) 
end 
else Error 
end ; 


Procedure Simple ; 

begin 
if Lookahead = integer Then match ( integer ) 
else if Lookahead=char Then match ( char ) 
else if Lookahead=num Then begin 

match ( num ) ; match ( dot dot ) ; match ( num ) 

end 
else Error 

end ; 


پارسر پائینگرد L‏ استفاده از حاصل اعمال تابعی بنام ۲ First‏ " ۳ روی رشته ۲ 


راست قواعد تعیین می کند که از کدامیک از قواعد گرامر UL‏ استفاده شود .تابع 


First(a) روی رشته ای از پایانه ها و غیرپایانه ها عمل می کند.حاصل تابع‎ First 


مجموعه ای از پایانه ها است که در سمت چپ ترین قسمت از رشته های تولیدشده از 


رشته 0 قرار می گیرند.تعریف رسمی تر این تابع بصورت زیر است : 


First(a) = {a|a=aB,a€T,BE(NUT)*} 


الگوریتم Caw bs‏ آوردن تابع ER First‏ رشته در بخش های بعدی آورده شده 


است,بعنوان مثال گرامر زیر را در نظر بگیرید. 
S — ۵0‏ 
A— abla‏ 


First(cAd) = {c} 
First(S) = {c} 
First(A) = {a} 


برای گرامر Type‏ خواهیم داشت : 
First(Simple) = {integer,char,num}‏ 


First(t id) = {f} 
First(array[Simple] of Type) = {array} 
First(Type) = {t,array,integer,char,num} 


به این ترتیب در گرامری که دو odel‏ بصورت 0 > A‏ و 8 ج A‏ داشته باشد 
پارسر پائینگرد با استفاده از First‏ سمت راست این قواعد , قاعده مناسب را تعیین هی 
کند بدون اینکه نیاز به عمل عقبگرد داشته باشد البته مشروط بر Kal‏ در چنین 


گرامرهایی شرط زیر برقرار باشد : 
First(a) N First(p) = p‏ 


۲-۳ استفاده از قاعده اپسیلون (A >E)‏ 
هر گاه در گرامری قاعده ایسیلون وجود داشته باشد پارسر پائینگرد از آن بعنوان قاعده 
پیش فرض ) (default‏ استفاده می کند.بدین معنی که اگر هیچ قاعده دیگری در گرامر 
مناسب تشخیص داده نشد پارسر از قاعده اپسیلون برای ادامه عمل تجزیه استفاده می کند. 
مثال : 


ST — begin STS end 

STS 4 STL | E 

STL— a 

فرض US‏ جمله ورودی begin end‏ باشد.درخت تجزیه پس از خواندن توکن 


: و بسط علامت شروع گرامر بصورت زیر خواهد بود‎ begin 


begin STS 


پس از تطبیق توکن begin‏ , ت وکن بعدی یعنی end‏ از اسکنر دریافت می گرددو نوبت 
به بسط STS Lb é‏ می رسد.چون 0 متعلق به مجموعه at essere First(STS)‏ 
از قاعده € >— STS‏ بعنوان قاعده پیش فرض استفاده می شود.درخت تجزیه بصورت 


زیر درخواهد آمد : 
ST‏ 


سپس توکن end‏ با پایانه end‏ در درخت تجزیه تطبیق می شود و عمل تجزیه خاتمه 


bh می‎ 


€ 
بايد توجه داشت که انتخاب قاعده E‏ برای بسط STS‏ تنها در صورتی که ت وکن جاری در 


of‏ لحظه end‏ باشد انتخاب درستی خواهد بود. 


۴-۳ مشکل چپ گردی ) Left Recursion‏ ( 
گرامری را چپ گرد گویند اگر غیرپایانه سمت چپ یک قاعده به عنوان اولین علامت 
سمت راست OT‏ قاعده ظاهر شده باشدوبعبارت دیگر غیرپایانه ای در گرامر و جود داشته 
باشد که قاعده ای بصورت AA‏ ج A‏ داشته باشد. 
روشهای پارس بالا به پائین را نمی توان برای گرامری که چپ گردی داشته باشد بکار 
برد.از اینرو باید چپ گردی گرامر را حذف کنیم یعنی گرامر را به گرامر معادلی تبدیل 
کنیم که در آن چپگردی وجود نداشته باشد.برای مثال گرامر چپ گرد 8 | A > Aa‏ 
را می توان بفرم زیر که چپ گردی ندارد تبدیل نمود : 
A ¬ ۵‏ 
A'— ۸ |e‏ 
هر دو گرامر فوق رشته هایی بفرم OB*‏ را توصیف می کنند. 
روش IS‏ حذف چپ گردی بصورت زیر است ( توجه کنید که اهمیتی ندارد که چه 
تعداد از قواعد چپ گرد باشند) : 
بطور IS‏ اگر داشته باشیم : 
A > Aa; | Ady |... | Adm | Bi ۱02۱۰۰۰۱ Bn‏ 


در قواعد فوق فرض بر این است که Bi‏ ها نباید با A‏ شروع شوند و هیچکدام از :0 ها 
نباید8 باشند.در اینصورت می توان قواعد زیر را بجای قواعد چپ گردی فوق بکار برد. 
B2A' |... | BoA’‏ | هرت ¬ A‏ 
oA' | ... | amA’ | E‏ | مره ب A'‏ 
اینگونه چپ گردی ها را " چپ گردی شکار ") (Immediate Left recursion‏ 
شیک eal‏ ی 5 CGS‏ هن ند از یک قدم ظاهر شود که به OT‏ چپ گردی ضمنی 
گویند.به عنوان مثال گرامر زیر دارای چپ گردی ضمنی است: 


S— ۵ | 0 
A — Ac | Sd 


در غیرپایانه ٩‏ چپ گردی ضمنی داریم زیرا : 


S => Aa = Sda 


۵-۳ حذف چپ گردی ضمنی ) (Implicit Left Recursion‏ 

ورودی الگوریتم گرامر G‏ با این شرط که قاعده اپسیلون نداشته باشد و هیچ دوری نیز 
RR e rs‏ در گرامر نباشد.خروجی الگوریتم 
گرامری معادل گرامر 6 اما فاقد چپ گردی است.ابتدا غیرپایانه های گرامر را به ترتیب 
دلخواه Aj,Ag,.--,An‏ مرتب می کنیم.سپس اعمال زیر را بصورت مشخص شده در 
حلقه های تکرار اجرا می کنیم : 


For 1:=1 to n do begin 
For j:=1 to 1-1 do begin 
را قرار دهید که‎ Ai ج‎ ۵,۷ | òy | ... | Oxy قواعد‎ Ai > Ajy بجای هر قاعده به شکل‎ 


در Aj — ۵۱ | 62 |... | OK OT‏ قواعد فعلی Aj‏ هستند 


end 
AS را حذف‎ Aj حال چپ گردی آشکار قواعد‎ 


end 


حال بعنوان نمونه الگوریتم فوق را برای گرامر زیر بکار می بریم : 


S— ۵ | 0 
A — Ac | Sd 


ابتدا غیرپایانه های گرامر را به ترتیب A‏ و ٩5‏ ( از چپ به راست ) مرتب می کنیم.از 
روی قاعده A —> Sd‏ خواهیم داشت : 

A ¬ Aad | bd 
: بصورت زير درخواهند آمد که دارای چپ کروی آشکار هستند‎ A به این ترتیب قواعد‎ 


A — Aad 
A — Ac 
A — bd 
: با حذف چپ گردی آشکار قواعد فوق گرامر زیر بدست می آید‎ 
S— ۵ | 0 
A - bdA' 
A'— cA' | adA' | € 


۶-۳ فا کتو رگیری از چپ ) Left factoring‏ ( 
با استفاده از فاکتورگیری از چپ می توان گرامرهایی که در آنها برای غیرپایانه A‏ دو 
قاعده بصورت ,0 ج A‏ و 08 A‏ وجود دارد را طوری add‏ داد که بتوان 
پارس بالا به پائین را برای این گرامرها استفاده کرد. 
مشکل این قبیل گرامرها در این است که روشن نیست که از کدامیکک از این قواعد باید 
برای بسط غیرپایانه A‏ استفاده کرد.بعنوان مثال : 

Stmt— if exp then Stmt else Stmt 

|if Exp then Stmt 

با دیدن If‏ در ورودی بلافاصله نمی توان گفت که از کدام قاعده برای بسط غیرپایانه 
Stmt‏ می توان استفاده کرد.در Se‏ کلی اگر 002 | ,0 جک A‏ دو قاعده موجود در 
گرامری باشند و ورودی با رشته .0 شروع شده باشد نمی توان گفت که ۸ را باید 
بصورت OB)‏ بسط داد و یا بصورت 0 .برای رفع این مشکل از » فاکتور می 


گیریم. گرامر را بصورت زیر تبدیل می کنیم : 


الگوریتم فاکتو ر گیری از چپ در حالت کلی بصورت زیر است : 
قواعد زیر را در نظر بگیرید : 
A ¬ af, | a2 |... | aBm | ۵۱ | 52 |... | On‏ 
که در OT‏ :8 بیانگر قواعدی است که سمت راست هیچ کدام با 0 آغاز نشده است.با 
فا کتو رگیری از چپ قواعد زیر حاصل می شوند : 
ONS‏ 2 
A' > Bi | 02۱۰۰۰ | Bm‏ 


که در OT‏ ۸ یک غیرپایانه جدید است. 


مثال: قواعد گرامری بصورت زیر می باشد : 
۳15 1ب و 
2 65 5 ] ۳ 1 ب- و 
E—b‏ 


این قواعد بعد از انجام عمل فا کتورگیری از چپ بصورت زیر تبدیل می شوند : 
٩ + ۵‏ 
ع | 5 ع ب و 
E—b‏ 


۷-۳ زبانهای غير مستقل از متن ) Non-Context Free Languages‏ ) 
زبانهایی هستند که نمی توان آنها را توسط یک گرامر مستقل از متن توصیف 
کرد.همچنین محدودیت هایی در زبانهای برنامه نویسی وجود دارد که نمی توان آنها را 
توسط گرامرهای مستقل از متن اعمال کرد.به مثالهای زیر توجه کنید . 


مثال ۱ -زبان زیر را در نظر بگیرید : 


Li- { wew | w is in (alb)* } 


این obj‏ رشته هایی بصورت aabcaab‏ تولید می کند.این رشته ها را می توان مشابه این 
محدودیت در زبانهای برنامه سازی در نظر گرفت که تعریف متغیرها بایستی قبل از 
استفاده از آنها قرار گیرد.به این ترتیب که ۷ اول در WOW‏ بیانگر تعریف متغیر بوده و 
W‏ دوم نشان دهنده استفاده از متغیر می باشد. 


declaration aab 
begin w 


قال ران {ab od” [nl S= 1. and nS=1‏ وا {ios‏ 
ی اش ان Od aD 6 0 ype slap ais‏ هی ES‏ در نوا فاد 
تکرار 2 Cul pl, CL‏ و تعداد تکرارهای 0 Gb‏ برابر است.اين زبان مشابه این 
محدودیت در زبانهای برنامه سازی است که تعداد پارامترهای رسمی در a‏ یک 
رویه بایستی با تعداد آ رگومانها در فراخوانی همان رویه برابر باشد.در اینجا می توان ٩"‏ و 
ای ارات ها رش دی رت ss‏ وم کت Ml siete‏ پراش 
eas‏ ان بر a‏ ما ی "wed aa‏ رای ان ان ماه 

آرگومانها در فراخوانی این رویه ها در نظر گرفت : 


dcl 0۳0061) a,a,a ) 
dcl ۰. 01002) b,b ) 


Call 01061) 6,6,0 ) 
Call proc2( d,d) 


مثال ۳ -زبان } 1 => Lz = { 200 | n‏ نیز مستقل از متن نیست.اين زبان رشته 


ols‏ بفرم "0 0 8 تولید می کند که در آنها تعداد 2 b,‏ , 6 برابر است.اين زبان مشابه 


مساله ایجاد GUIS‏ که در زیر آنها خط ois‏ شده باشد Underlined Word)‏ ( 
است. اینگونه کلمات به این صورت چاپ می شوند که ابتدا کاراکترهای یک کلمه چاپ 
شده و بدنبال OT‏ به تعداد کاراکترهای OT‏ کلمه به عقب برگشته ( با کمک کاراکتر 
6 ) و سپس به همان تعداد کاراکتر " _ " چاپ می شود.مثلا کلمه Read‏ 
,در L; obj‏ اگر a‏ بیانگر حروف Sy b,‏ کاراکتر 13201650206 و ۵ نیز بیانگر 
کاراکتر " _ " باشد آنگاه این obj‏ کلمات Underlined‏ را تولید می کند. 


فوق , مستقل از متن هستند.بعنوان مثال زبان 1,۱ که بصورت زیر تعربف شده است 
مستقا از متن است : 


L,'= { wew® | w is in(a]b) } 

این زبان را می توان بوسیله گرامر زیر تولید کرد : 
S — aSa | 090 | c‏ 
زان 1 => abe d (n= 1 and nh‏ = و نیز مستقل از متن است و با 


: گرامر زیر توصیف می شود‎ 
S— AB 
A — aAb | ab 
B — cBd | cd 


بصورت زیر است : 
S — 290 | ab‏ 


۸-۳ استفاده از دیاگرام های JESI‏ برای ooly‏ سازی پارسرهای پیشگو 
برای طراحی پارسرهای پیشگو نیز می توانیم از دیاگرام cle‏ انتقال استفاده کنیم.به این 
ترتیب که ابتدا ساختار نحوی زبان را با استفاده از گرامر ایجاد می کنیم.سپس از روی 
گرامر دیاگرام cle‏ انتقال را رسم می کنیم.در پارسرها برای هر غیرپایانه یک دیاگرام 
انتقال داریم .برچسب های لبه های این دیاگرام ها می توانند پایانه و یا غیرپایانه 
باشند.انتقال از طریق لبه cle‏ با برچسب پایانه به منزله اینست که در ورودی نیز نشانه ای 
معادل با برچسب مشاهده شده است.در انتقال از طریق col ad‏ با برچسب lly pe‏ مانند A‏ 
به منزله فراخوانی رویه ای برای A‏ می باشد.برای ایجاد دیاگرام یک گرامر ابتدا باید 
چپ گردی گرامر را در صورت وجود برطرف کرد.همچنین هرکجا که لازم باشد بایستی 
عمل فاکتورگیری از چپ انجام شود.سپس برای رسم دیاگرام مراحل زیر را برای هر 
غیرپایانه انجام می دهیم : 

۱- یک حالت شروع و یک Se‏ نهایی ایجاد کنید. 

۲- برای هر قاعده به فرم ...×× + A‏ یک مسیر از حالت شروع به حالت 


نهایی رسم می کنیم و به لبه ها برچسب های X1X2...Xm‏ می دھیم. 


حال بعنوان نمونه دیاگرام cle‏ انتقال گرامر زیر را رسم می کنیم. 
E — TE'‏ 
ع | ۲۳+ ب ۴ 
T — ۲۳‏ 
T' +> *FT' |e‏ 
F — (E) | id‏ 


01040 


E )‏ ( 
و ابا رس توت ابا 
ا PS‏ 


گاهی اوقات دیا گرام cle‏ انتقال را می توان ساده تر کرد.به عنوان مثال دیاگرام های فوق 


را در نظر بگیرید. 


و با جاگذاری این دیا گرام ساده شده در دیا گرام E‏ خواهیم داشت : 


ORORO) 
o-0 
a 

CoO) 


به همین ترتیب برای دیا گرام های Ty T'‏ خواهیم داشت : 


OROORO. 


٩ -۳‏ تجزبه پیشکو db‏ غير باز گشتی ) Non-Recursion Predictive Parsing‏ ( 
در این روش تجزیه از یک انباره ( (Parse Stack‏ و یک جدول به نام جدول تجزیه 
(Parsing Table )‏ استفاده می گردد.بافر ورودی شامل رشته ای است که بايد تجزیه 
شود.در انتهای رشته ورودی علامتی مثلا 3 قرار می گیرد.ساختار کلی این نوع پارسر 


Output‏ برنامه پارس پیشگو 


در ابتدای پارس علامت $ وارد انباره می شود و روی OT‏ علامت شروع گرامر قرار می 
گیرد.در انتهای پارس هم در انباره بافر هم در ورودی تنها علامت $ باقی می 
ماند.جدول پارس یک آرایه دوبعدی بصورت [ 2 , ۸ ] ۷1 است که در ER A OT‏ 
غیرپایانه و SLES a‏ و یا علامت $ است.فرم IS‏ جدول بصورت زیر است : 


پایانه ها و علامت $ 


برخی از خانه های جدول حاوی شماره ER‏ قاعده از گرامر و برخی از آنها خالی است. 


در هر قدم از پارس برنامه پارس علامت X‏ بالای انباره و Token‏ جاری a‏ در ورودی 
را مورد بررسی قرار می دهد و بصورت زیر تصمیم می گیرد : 
51-1 $ = 2 = ٭ باشد پارسر پایان موفقیت آمیز پارس را گزارش می دهد. 
fiy‏ $ ۶ 2 = ۸ باشد پارسر X‏ را از بالای انباره حذف و توکن بعدی را 
دریافت می کند.اگر X‏ پایانه باشد و با 2 مطابقت نکند یک خطای نحوی رخ 
داده است. 
۳ اگر X‏ یک غیرپایانه باشد برنامه به خانه a]‏ , × ] ۷ مراجعه می کند که در 
OT‏ یا شماره قاعده ای به فرم A + ABC‏ قرار دارد و با خالی است.در صورت 
اول , پارسر 2۶ را از بالای انباره حذف و بجای ABC oT‏ را وارد انباره می AS‏ 
به نحوی که WA‏ انباره قرار گیرد.در صورتیکه خانه a]‏ , × ] ۷ خالی 


باشد oles ER‏ نحوی رخ داده است. 


Follow 9 First توابع‎ ۱۰ -f 
استفاده می‎ Follow و‎ First برای پر کردن جدول پارس از توابعی به نامهای‎ 
شود.همانگونه که قبلا توضیح داده شد (۳1150)0 مجموعه پایانه هایی است که بعنوان‎ 


سمت چپ رین علامت رشته های بدست odl‏ از 0 قرار می گیرند.در صورتیکه 


6 05 در اینصورت 6 نیز جزو First()‏ خواهد بود.در ادامه الگوریتم محاسبه First‏ 


یک علامت مثل × توضیح داده شده است.اگرچه الگوریتم در مورد یک علامت بیان 
می گردد لیکن با کمک OT‏ می توان مجموعه First‏ را برای رشته ها نیز محاسبه نمود. 
برای پیدا کردن First(X)‏ بصورت زیر عمل می شود( X‏ می تواند یک BLL‏ یا یک 
غیرپایانه باشد ) : 

۱- اگر X‏ یک پایانه باشد در آنصورت First(X) = {X}‏ 


۲- اگر قاعده ای بصورت € ج × در گرامر باشد ع را به First(X)‏ اضافه می 


es 


۳- اگر قاعده ای به فرم Viyr ... Yk‏ ج X‏ در گرامر موجود باشد ابتدا 
ce ( First(y)) - €‏ مجموعه (1151)7۱ cle‏ 6 ) را به First(X)‏ اضافه 
می کنیم.درصورتیکه ع = First(y2)-€, yı‏ را نیز به First(X)‏ اضافه 
می کنیم.( در غیر اینصورت کار یافتن First(X)‏ از طریتق قاعده فوق خاتمه می 
یاید. )در صورتیکه ع = First(y3) - €, yo‏ را هم به First(X)‏ می 


افزائیم.این کار آنقدر ادامه می یابد تا آنکه € عضو مجموعه First(y;)‏ , به ازای 
> [ > 1 نباشد.در صورتیکه & = First(y,) 46 Yer‏ را نیز به 


First(X)‏ اضافه بکنیم. 


به عنوان مثال گرامر زیر را در نظر بگیرید. 
A — aB‏ 
B—Cb|d‏ 
C—>elc‏ 


First(A) = {a} و‎ First(B)={c,b,d} و‎ First(C)= {e,c } 


برای بدست آوردن A) Follow(A)‏ یک غیرپایانه است ( اعمال زیر را آنقدر ادامه 
می دهیم تا اینکه دیگر چیزی به مجموعه Follow(A)‏ اضافه نشود : 
1 $ رادر Follow(S)‏ قرار می دهیم.( S‏ علامت شروع گرامر است ) 
۲ اگر قاعده ای بصورت GAB‏ > × داشته باشیم هرچه در First(B)‏ 
قرار دارد pe)‏ از €( رابه مجموعه Follow(A)‏ اضافه می کنیم. 
۳ اگر قاعده ای بفرم OA‏ ج atl X‏ باشیم و یا aKT‏ قاعده ای بفرم 
۵( — × و £ *= B‏ , هرچه در Follow(X)‏ قرار دارد را به 
مجموعه Follow(A)‏ اضافه می کنیم. 


به عنوان مثال گرامر زیر را در نظر بگیرید : 


ع | ۲+ مب ۶ 

TRT 
۳ ع |8۳ * ب‎ 
F—(E)|id 


Follow (cla مجموعه‎ First مجموعه های‎ 


Follow(E) = {), $} First(E) = { (, id } 
Follow(T)={+,),$} First(T) = { (, id} 
Follow(F)={*,+,$,)} | First(F)={(,id} 
Follow(E') = {), $} First(E') = {e , +} 
Follow(T) = {+,),$} First(T') = {8 ,* } 


نحوه تشکیل جدول پارس برای پارسر های پیشکو : 
۱- برای هر قاعده بصورت 0 A‏ در گرامر قدمهای ۲ و ۳ را انجام می دهیم. 
۲- برای هر پایانه a‏ در ۳1۳510 , شماره قاعده 0 ج ۸ seal,‏ [۵ , ۸ ] ]1۷ 
اضافه می کنیم. 
۳- اگر £ در First(a)‏ وجود داشت شماره قاعده d‏ ج ۸ را در خانه های 


M ] A , 9 |‏ به ازای هر b € Follow(A)‏ قرار می دهیم. 


جدول پارس گرامر مثال قبل بفرم زیر است : 


۱ ( ) 


$ 


1 


حال با استفاده از جدول فوق عبارت id‏ * 10 +10 را تجزیه می کنیم : 


محتوای انباره 


وزودی 


قواعد استفاده شده 


$E 


id +id *id $ 


E>TE' 


$ E' T 


id +id *id $ 


۳ ۲ ب ]1 


$ E' T'F 


id + 10 * id $ 


F > id 


$ E' T' id 


id +id * id $ 


$E'T' 


+id * id $ 


T'—>e 


$ E' 


+id*id$ 


E'>+TE 


$E' T+ 


+ id * id $ 


$ E' T 


id * id $ 


To FT' 


$E'T'F 


id * id $ 


F > id 


$ E' T' id 


id * id $ 


$ E' T' 


*id$ 


T—*FT 


5 E' T'F * 


*id$ 


F — id 


$E TF 


id $ 


$ E' T' id 


id $ 


$ E' T' 


$ 


$ E' 


$ 


$ 


$ 


LL(1) 6b& pl F 
در صورتیکه از روش فوق برای ایجاد جدول پارس گرامرهای گنگ و یا چپ گرد‎ 
استفاده شود در برخی از خانه های جدول پارس بیش از یک شماره قاعده خواهیم‎ 
جدول پارس یک گرامر مستقل از متن حداکثر‎ cle داشت.بعبارت دیگر اگر در خانه‎ 
گویند.‎ LLL) باشد گرامر مربوطه را‎ odeli یک شماره‎ 
: مثال - گرامر زیر را در نظر بگیرید‎ 

۵ 15ج 5 


و | ٩‏ ع ب و 
E—b‏ 


جدول پارس گرامر فوق بصورت زیر است : 
5 


3,4 


این گرامر LL(1)‏ ست زیرا در خانه MI[S',e]‏ حدول S‏ به oT‏ دو شماره قاعده قرار 


دارد. 


برای پی بردن به (11)1 بودن یک گرامر لازم نیست که حتما جدول تجزیه OT‏ بدست 


آید.با بررسی شرایط زیر نیز می توان LLC)‏ بودن یک گرامر را بررسی نمود.بعبارت 
دیگر گرامری LLL)‏ است که شرایط زیر در مورد قواعد بصورت 8 | 0 ج ۸ OT‏ 


LS صدق‎ 


First(B) N First(a) = 0 .\ 
First(B) N Follow(A)=@ در آتصورت‎ a=*e اگر‎ ۳ 


بعنوان مثال گرامر زیر را در نظر بگیرید : 
E>TE‏ 
|e‏ ۲ + ۴۳ 
To ۲ ۳‏ 
T—>*FT'|e‏ 6 
E. FENDI‏ 


5 
E 


شرایط LLC)‏ بودن را برای گرامر فوق چک می کنیم.از آنجا که غیرپایانه های E‏ و 


: E' تنها یک قاعده دارند نیازی به بررسی ندارند.در مورد غیرپایانه‎ T 


First(+TE') = , First(e)={e} , fe} N {+} =o 
First(+TE') = , Follow(E') = {$,)} , {+} N {£$) } =o 
: داریم‎ T' و برای غیرپابانه‎ 

First(*FT') = {*} , First(e)={e} , fe} ۲۱ {*} <‏ 
First(*FT") = { * } , Follow(T') = {$,),+} , {*}N {$),+}=©‏ 
حال شرایط را برای غیرپایانه ‏ بررسی می کنیم : 

First((E)) = {(} , First(id)= {id} , {(} N 110 ۲ < 0۵ 
است.‎ LLL) لذا گرامر‎ 


حال بعنوان یک مثال دیگر گرامر زیر را در نظر بگیرید : 
2 65 1ب 5 
ع | 65 ب و 
E—b‏ 


کنیم مشخص خواهد شد که این گرامر LLL)‏ نیست. 
First(eS) = {e} , Follow(S')= 16,8۲ , ) 6,8 ( N fet#o‏ 


گرامرهایی که چپ گردی داشته باشند LLL)‏ نیستند.برخی از گرامرها را می توان با 


حذف چپ OS‏ و فاکتورگیری از چپ به گرامر pas LLA)‏ کرد.ولی 


فاکتورگیری و حذف چپ گردی باعث از بین رفتن خوانایی گرامرها می شوند.در ضمن 
لیا کارا تز فشک در می ماد 


۱۱-۳ روش های اصلاح خطای نحوی در روش تجز به LL)‏ 


از مهمترین روشهای اصلاح خطای قابل استفاده در تجزیه LL(1)‏ عبارتند از : 

Panic Mode روش‎ © 

© روش Phrase Level‏ 
بطور کلی در روش LLC)‏ زمانی یک خطای نحوی تشخیص داده می شود که يا BLL‏ 
بالای انباره با ت وکن جاری تطبیق نکند و یا با غیرپایانه بالای انباره A‏ و توکن جاری a‏ 
Je 1۷1 ] ۸ , 2 [ se‏ باشد. 
در روش Panic Mode‏ اگر پارسر با مراجعه به یک خانه SE‏ جدول تجزیه ER‏ 


خطای نحوی بیابد آنقدر از رشته ورودی حذف می کند تا به یکی از اعضا مجموعه ای 


موسوم به مجموعه Synchronizing‏ برسد.در روش Panic Mode‏ به ازای هر 


غیرپایانه در گرامر یک مجموعه Synchronizing‏ در نظر گرفته می شود. کارایی 
روش Panic Mode‏ نیز بستگی به انتخاب مناسب مجموعه Synchronizing‏ 
دارد.این مجموعه wb‏ يه گونه ای تعیین شود که عمل تجزیه بتواند بدون حذف قسمت 
زیادی از ورودی به کار خود ادامه دهد.یکک انتخاب مناسب , در نظرگرفتن مجموعه 
Follow‏ هر غیریایانه به عنوان مجموعه OT Synchronizing‏ غیرپایانه است.با این 
وجود در نظر گرفتن مجموعه Follow‏ تنها برای Synchronizing‏ کافی نیست.برای 
اینکه حذف کمتری در برنامه ورودی صورت بگیرد می توان نمادهای بیشتری را به این 
مجموعه افزود.مثلا می توان مجموعه First‏ غیرپایانه ها را نیز به مجموعه 
eT Synchronizing‏ افزود.به عنوان یک مثال از نحوه عمل پیاده سازی روش 
Panic Mode‏ در LL(1) «j‏ گرامر زیر را در نظر بگیرید : 
EZ TE‏ 


E'4+TE'|# 
] 


|۲۳ ۳ * ب- ۳[ 

0 | ( 1 ) ب ۲ 
مجموعه Follow‏ غیرپایانه ها را به عنوان مجموعه Synchronizing‏ آنها در نظر 
گرفته و در جدول تجزیه در Follow [lis‏ غیرپایانه ها با گذاردن علامتی مثل " 5 " 
مجموعه Synchronizing‏ هر غیرپایانه را معین می کنیم.به این ترتیب جدول پارس 


گرامر فوق بصورت زیر در خواهد آمد : 


برای اصلاح خطا به روش Panic Mode‏ در الگوریتم تجزیه LL)‏ بصورت 
زیر عمل می کنیم : 
-١‏ اگر پارسر خانه [ 2 , ۸ ] ۷ را JE‏ ببیند علامت a‏ را در ورودی نادیده می 


گیرد. 
۲- اگر در محل خانه [ 2 , ۸ ]1۷ علامت "S"‏ باشد غیرپایانه بالای Lode oll‏ 


می شود.مشروط برآنکه A‏ تنها غیرپایانه موجود در انباره نباشد. 
۳- اگر پایانه بالای انباره با ورودی جاری تطبیق نکند پایانه بالای انباره حذف می 


a 


سو د. 


۳ - ۱۲ تجزیه cwb‏ به (Bottom-Up Parsing ) YL‏ 
یک روش کلی تجزیه پائین به بالا به روش انتقال - کاهش ( Shift — Reduce‏ ( 


است.در این روش عکس تجزیه بالا به gdh‏ عمل می شود.به این ترتیب که از رشته 


ورودی شروع کرده و ساخت درخت تجزیه از ب رگ ها آغاز گشته و به طرف ریشه 


) علامت شروع ) پیش می رود. 
ترتیب بکارگیری قواعد در پارس بالا به پائین درست مطابق بسط چپ است درحالیکه 
ترتیب بکارگیری قواعد در اکثر روشهای تجزیه پائین به بالا درست عکس بسط راست 
است. گرامر زیر را در نظر بگیرید : 

1 S — aABe 


2-3 ۸ ۵ 
4 B-d 


جمله 200606 را مورد بررسی قرار می دهیم.بسط راست این جمله بصورت زیر است : 


4 2 3 
= aAde => aAbcde = abbcde 


rm rm rm 


که در of‏ ترتیب بکارگیری قواعد گرامر بصورت 1,4,2,3 ( از 


است. تجزیه پائین به بالای رشته فوق در جدول زیر آمده است : 


مرحله تجزبه فرم جمله ای تحت تجزیه 


S 


aABe 


aAde 


aAbcde 
abbcde 


به این ترتیب جمله abbede‏ به علامت شروع گرامر کاهش می یابد.ترتیب عملیات در 
این کاهش درست برعکس بسط راست صورت گرفته است.در هر مرحله از کاهش در 
پارس پائین به بالا این مشکل وجود دارد که پارسر کدام زیر رشته را به عنوان دستگیره 
انتخاب و سپس از کدام قاعده برای کاهش OT‏ استفاده نماید.در ادامه به ارائه چند تعریف 
در ارتباط با تجزیه پائین به بالا می پردازیم : 
عبارت ( Phrase‏ ) : بخشی از یک فرم جمله ای است که از یک غیرپایانه بوجود 
آمده باشد.به عنوان مثال در بسط زیر B‏ یک عبارت محسوب می شود. 

SS aAy = apy 


عبارت ساده ) (Simple Phrase‏ : عبارتی Cul‏ که در یک قدم بوجود آمده 


باشد.به عنوان مثال در بسط زیر 8 یک عبارت ساده است. 


٩ aAy => apy 


دستگیره ( Handle‏ ( : عبارت ساده ای است که در جهت عکس یک بسط راست 
als‏ شده باشد.در dite‏ زیر op Sous ES B‏ است.توجه داشته باشید که از آنجایکه 
دستگیره در رابطه با بسط راست مطرح است سمت راست دستگیره هیچ غیرپایانه ای 
نیست.به همین خاطر در مثال زیر از " × ۲ تراک ماش زیر رغه مت راست Seals‏ ره 
استفاده شده است. 


S Š, aAx= aßx 


اگر گرامر مورد استفاده گنگ نباشد در هر مرحله از تجزیه پائین به بالا تنها یک دستگیره 

وجود دارد.لیکن در صورت استفاده از یک گرامر گنگ ممکن است در بعضی از قدم ها 

بیشتر از یک دستگیره موجود باشد.به مثال زیر توجه کنید : 
E>E+E|/E*E|(E)|id‏ 1-4 


از آنجا که گرامر فوق ERE‏ است برای جمله id * id‏ + 10 دو سط راست و در dows‏ 
دو مسیر تجزیه پائین به بالا وجود دارد.این دو بسط در ادامه نشان داده می شود.همانگونه 


که مشاهده می شود در قدم سوم تجزیه دو انتخاب برای دستگیره وجود دارد. 


= E+ id * id = E+ 10 * id 


= 1d + id * id = 10 + id * id 


۱۳۳ پیاده سازی روش تجزیه انتقال - کاهش با استفاده از یک انباره 


Z. ۳ ۰ ۰ ۰ ۳۹‏ 0 
در این روش از یک انباره و pl EX‏ ورودی Cee‏ نگهداری رشته ای که بايد تجزیه 


شود استفاده می گردد.در وضعیت شروع تجزیه به انتهای ورودی یک علامت ۲ 5 " 


اضافه می گردد که خاتمه رشته ورودی برای پارسر مشخص می گردد.درون انباره نیز 
یک علامت "$" وارد می گردد. 
پارسر آنقدر دو عمل انتقال و کاهش را انجام می دهد که یا یک خطای نحوی مشاهده 
گردد و یا اینکه به وضعیت خاتمه پارس برسد.وضعیت خاتمه تجزیه به این صورت است 
که ت وکن جاری علامت " 5 " است و درون انباره نیز تنها علامت شروع گرامر بر روی 
علامت " $ " که در ابتدای تجزیه وارد انباره گردیده است قرار دارد. 
بطور رسمی تر اعمالی که ER‏ پارسر انتقال - کاهش انجام می دهد عبارتند از : 
۱- انتقال ( (Shift‏ : تعدادی از علائم ورودی به بالای انباره انتقال می یابد.عمل 
انتقال تا زمانی ادامه می یابد که دستگیره در بالای انباره تشخیص داده شود. 
-Y‏ کاهش ( (Reduce‏ : دستگیره ای در CYL‏ انباره ظاهر شده است.دستگیره از 
بالای انباره حذف و بجای OT‏ غیرپایانه سمت چپ قاعده ای که سمت راست OT‏ 
مطابق دستگیره است وارد انباره می شود. 
۳- قبول ورودی ( (Accept‏ : پارسر OLE‏ موفقیت آمیز تجزیه را اعلام می AS‏ 
-f‏ تشخیص خطا ( Error‏ ) : پارسر یک cles‏ نحوی را تشخیص داده و )49 


jlo ples‏ را فرا می خواند. 


به عنوان نمونه تجزیه رشته 10 * 10 + 10 به روش انتقال - کاهش بصورت زیر است : 


عمل انجام شده باقیمانده ورودی میج ای انباره 
انتقال id +id * id $ id‏ $ 
کاهش بوسیله id‏ ج id + id * id $ E‏ $ 
انتقال + $ $E + id * id‏ 
انتقال SEE id * id $ id‏ 
کاهش بوسیله id‏ ج ٩ ۴ + id * 10 5 E‏ 
انتقال * ٩ ۲ + ۳۲ *id$‏ 
انتقال $E+E* id $ id‏ 
کاهش $E+E* id $ E > id day‏ 
٩ ۲ + ۳ FE‏ 


E > E*E کاهش بوسیله‎ 


5 
5 ۲ + ۳ 5 E > EHE کاهش بوسیله‎ 
SE $ 


Accept 


در تجزیه به روش انتقال — کاهش مشکلات زیر وجود دارد : 
۱- تصمیم گیری در مورد اينکه کدام زیررشته تشکیل یک دستگیره می دهد. 
۲- انتخاب قاعده ای که LL‏ برای کاهش استفاده شود.این مشکل زمانی بروز می AS‏ 
که سمت راست بیش از یک قاعده با دستگیره مطابقت می کند.به چنین وضعیتی 
" تداخل کاهش- کاهش Reduce / Reduce Conflict)"‏ ) گفته می شود. 


۱۴-۳ انواع تداخل در تجزیه انتقال - کاهش 
در پارس انتقال — کاهش دو نوع تداخل می تواند روی دهد : 
-i‏ تداخل انتقال - کاهش ) Shift / Reduce Conflict‏ ) : 
زمانی روی می دهد که پارسر نتواند تصمیم بگیرد که عمل انتقال Lb‏ انجام دهد 
یا عمل کاهش. 
-r‏ تداخل کاهش - کاهش ( (Reduce / Reduce Conflict‏ : 
اگر بیش از یک قاعده جهت کاهش موجود باشد اینگونه تداخل روی خواهد 
داد. 
به عنوان مثالی از تداخل نوع اول گرامر زیر را در نظر بگیرید : 
Stmt — if expr then Stmt‏ 


| if expr then Stmt else Stmt 
| other 


فرض کنید توکن جاری "if expr then Stmt"«s,, "else"‏ بالای انباره 
قرار داشته باشد.با توجه به وضعیت انباره , پارسر هم می تواند با استفاده از قاعده اول 
عمل کاهش انجام دهد و هم می تواند ابتدا توکن جاری را به بالای انباره انتقال داده و در 
زمان مناسب با استفاده از قاعده دوم عمل کاهش را انجام دهد. 
حال به مثالی از تداخل نوع دوم توجه کنید. گرامر زیر را در نظر بگیرید : 
Stmt — 1d ( Parameter-list ( | Expr := Expr‏ 1-2 
 Parameter-list — Parameter-list , Parameter | Parameter‏ 3-4 


Parameter — id 
Expr — id ( Expr-list ( | id 


6-7 
8-9  Expr-list — Expr-list , Expr | Expr 


قاعده شماره 1 این گرامر Cg‏ توصیف فراخوانی رو به ls‏ و قاعده 6 گرامر Cg‏ 
رت همع AOE TEE oh Maal‏ 
آمده باشد.این بخش از ورودی بوسیله اسکنر بصورت " (10)10,10 " kas‏ می 
گردد.همچنین فرض کنید در وضعیتی از تجزبه قرار داریم که باقیمانده ورودی بصورت 
",id)...5 "‏ و زیررشته " 10010 " بالای انباره ظاهر شده باشد.در این حالت از دو 


" 


قاعده جهت عمل کاهش id y‏ "می توان استفاده نمود ( قواعد 5و 7).یعنی یک تداخل 
کاهش 7 eS pals‏ داده است.در این Jt‏ انتخاب قاعده درست بستگی به نوع متغیر A‏ 
دارد.در صورتی که ۸ یک رویه باشد باید از قاعده 5 و اگر ۸ یک آرایه باشد باید از 


قاعده 7 برای عمل کاهش استفاده شود.یعنی پارسر Lh‏ با مراجعه به جدول نشانه ها و پی 
بردن به نوع A‏ این تداخل را حل کند.راه حل دیگری نیز جهت رفع این نوع مشکل 
وجود دارد.ا گر اسکنر در هنگامی که متغیر ورودی یک رویه است بجای توکن "id"‏ 
ت وکن دیگری "Se‏ 0 " به پارسر انتقال دهد دراینصورت در موقع برخورد با 
وضعیت تداخل کافیست پارسر داخل انباره و توکن زیر " ) " را بررسی کند.اگر این 
توکن 01۳0010 باشد پارسر از قاعده شماره 5 و در po‏ اینصورت از قاعده شماره 7 
جهت کاهش 1d‏ بالای انباره استفاده می کند.توجه داشته باشید که در اینصورت قاعده 
شماره 1 بایستی بصورت زیر اصلاح گردد : 
Stmt — procid( Parameter-list)‏ 


۱۵-۳ روش تجز 4 pas‏ — عملگر ( Operator-Precedence Parsing‏ ( 
sol F‏ عملگر : گرامری است که دارای خصوصیات زیر باشد : 

۱ قاعده € نداشته باشد. 

۲ در سمت راست هیچ قاعده ای از OT‏ دو غیرپایانه مجاور نباشند. 
به عنوان مثال گرامر زیر یکت گرامر عملگر نیست زیرا سمت راست قاعده E — EAE‏ 
دو غیرپایانه مجاور دارد. 


E ¬» EAE | (E) | -E | id 
۸۵ + ۱-1 


اگر این گرامر را بصورت زیر تبدیل کنیم گرامر عملگر خواهد شد : 
E —> E+E | E-E | E*E | E/E | ETE | (E) | -E | id‏ 


قذ کو : یکی از شرایطی که باید وجود داشته باشد تا بتوان از روش تجزیه تقدم - عملگر 
استفاده نمود این است که گرامر باید یک گرامر عملگر باشد. 


معایب روش پارس PAB‏ - عملگر 


روش تقدم - عملگر علیرغم داشتن مزیت پیاده سازی آسان دارای معایبی نیز است.این 


معایب عبارتند از : 


۱- به [Jo‏ محدودیت هایی که دارد گرامرهای کمی وجود دارند که بتوان از این 
روش برای آنها استفاده کرد. 
۲- در مورد اپراتورهایی مانند ' - MINUS)’‏ ) که دارای دو تقدم متفاوتند ( بسته به 
اینکه منهای unary‏ است binary L‏ ) این روش کار نمی AS‏ 
۳- روش چندان دقیقی نیست.یعنی ممکن است برخی از خطاهای نحوی را نتواند 
کف کین 
در پارس تقدم - عملگر از سه رابطه تقدم مابین عملیات جهت هدایت عمل تجزیه 
استفاده می گردد.در این روش روابط تقدم YS‏ بین پایانه ces‏ کر اهر و توت ویر 
تعریف می گردد : 
۱- 0 > 2 یعنی پایانه a‏ از پایانه ‏ تقدم کمتری دارد.مانند * > + 


۲- 0 = 2 یعنی پایانه a‏ و پایانه b‏ از تقدم یکسانی برخوردارند.مانند ( = ) 


۳ 0 < 2 یعنی پایانه 2 از پایانه b‏ تقدم بیشتری دارد.مانند * > Id‏ 


روابط تقدمی که در اینجا بین پایانه ها توصیف می شود با روابط > ,= ,< معمولی که 
در بین اعداد طبیعی برقرار است تفاوت زیادی دارند.به عنوان نمونه در اینجا با دانستن 
اینکه رابطه 0 > 2 برقرار است نمی توان نتیجه گرفت که 2 < 0 .از طرفی ممکن است 
در پایانه هیچیک از این سه رابطه تقدم را با هم نداشته باشند و یا اينکه دو پایانه دو رابطه 


تقدم متفاوت داشته باشند.مثلا داشته باشیم که * > - و هم * < -. 


۳- ۱-۱۵ الگوریتم تجزیه تقدم - عملگر 


این ساختار که در شکل زیر نشان oala‏ شده است مولفه اصلی پارسر یک برنامه است که 
از یک طرف ورودی خود را از اسکنر دریافت می کند و از یک انباره برای ذخیره 
اطلاعات و از یک جدول تجزیه برای هدایت عمل تجزیه استفاده می کند.در این روش 
پارسر ابتدا یک علامت $ به انتهای رشته ورودی اضافه می کند.انباره نیز در ابتدای کار 
فقط fold‏ یک علامت $ است. 

جدول پارس در این روش یک جدول دو بعدی مربع است که به تعداد SLL‏ های بعلاوه 
یک ( به Core LE‏ $( سطر و ستون دارد.در داخل جدول نیز در برخی خانه های 


جدول یکی از علامت cle‏ > , < و يا = قرار دارد و مابقی خانه cle‏ جدول SE‏ است. 


جدول پارس 


Stack 


در این روش برنامه پارس در هر قدم از پارس با استفاده از بالاترین پایانه انباره (2) و 
ت وکن جاری O)‏ ( به غیرپایانه بالای انباره توجهی ندارد ) به عنوان اندیس جدول 
تجزیه و مراجعه به این جدول یکی از اعمال زیر را انجام می دهد : 

۱- اگر abl,‏ پایانه CYL‏ انباره و ت وکن جاری بصورت 0 > a‏ باشد پارسر ابتدا 
علامت > و سپس توکن جاری 0 را به بالای انباره انتقال می دهد. 

۲- اگر رابطه CYL SLL‏ انباره و توکن جاری بصورت D‏ = 2 باشد پارسر فقط 
ت وکن جاری را به CYL‏ انباره انتقال می دهد. 

۳- اگر رابطه پایانه بالای انباره و ت وکن جاری بصورت 0 A>‏ باشد پارسر عمل 
کاهش را انجام می دهد.برای اینکار در داخل انباره آنقدر پائین می رود تا به 
اولین علامت > برسد , دستگیره رشته مابین این علامت و بالای انباره است 
( بعلاوه غیرپایانه زیر علامت > در صورت وجود ) .پارسر برای انجام عمل 
کاهش دستگیره پیدا شده را از انباره حذف و به OT cle‏ یک غیرپایانه نوعی 


( مثلا (N‏ وارد انباره می کند.( در روش تقدم - عملگر پس از تهیه جدول 


تجزیه از روی گرامر دیگر بین غیرپایانه ch‏ گرامر تمایزی قائل نمی شویم و 


بجای همه آنها می توان از یک غیرپایانه نوعی استفاده نمود.همچنین این عامل 
باعث ضعف این روش در کشف برخی از خطاهای نحوی گردیده است) 
۴- اگر پایانه CYL‏ انباره با ورودی جاری رابطه ای نداشته باشد یک خطای 
حال به عنوان مثال به a jas‏ رشته id + 10 * id‏ با استفاده از جدول تجزیه گرامرغیر 
گنگ عبارات جبری توجه کنید.جدول تجزیه و مراحل تجزیه بصورت قدم به قدم در 
شکل های صفحه بعد آمده است.در قدم هایی که عمل کاهش صورت گر فته زیر 
دستگیره des‏ کشیده شده است. 


E->E+T |T 
T—T*F | F 
F— (E) | id 


عمل انجام شده ورودی 
انتقال > و id + id * id $ id‏ $ 
کاهش بوسیله id‏ ج id $ E‏ * 0 + 0 > $ 
انتقال > و + 5 E + id * id‏ $ 
انتقال > و ٩ ۲ > + id * id $ id‏ 
کاهش بوسیله 10 ج ٩ [۲ > + > 0 * 10 $ E‏ 
افیا ٩ ۲ > + ۲ * 10 $ * ae‏ 
انتقال > و 10 $ Eas id‏ ۵ ۶ 


$E<+E<*<id $ E= 10 کاهش بوسیله‎ 
٩ ۳ > + ۳ ۳ 


E > E*E کاهش بوسیله‎ 


$ 
$E<+E $ E ب‎ FHE کاهش بوسیله‎ 
$E $ 


پایان پارس 


۲۱۵-۳ نحوه بافتن روابط تقدم 
برای تعیین روابط تقدم از دو تابع با تعریف زیر استفاده می کنیم.اين دو تابع روی 
غیرپایانه ها تعریف شده اند و حاصل آنها مجموعه ای از پایانه ها است. 


Firstterm(A) = {a| A= مه‎ or A= Baa } 
Lastterm(A) = {a| A = aa or A =» aaB } 


که در آن 2 یک پایانه B,‏ یک غیرپایانه KOs‏ رشته از پایانه و غیرپایانه است. 


با توجه به تعاریف توابع فوق رابطه cle‏ تقدم بصورت زیر تعریف می شوند : 
or U-...awb...‏ ...20 ... ب لا iff‏ 
iff QOU—-...aW... and b€ Firstterm(W)‏ 
iff QOU—-...Wb... and a€ Lastterm(W)‏ 
که ۷۷ یک غیر پایانه است. 


حال به عنوان مثال گرامر زیر را در نظر بگیرید : 
E—E+T|T‏ 
۲ | ۲ * 1ب ۲ 
0( ۳ ) «- ۲ 
اگر Firstterm‏ و Lastterm‏ را بر روی غیرپایانه های این گرامر اعمال کنیم حاصل 
بصورت زير خواهد شد : 
Firstterm(E) = { +, *‏ 
Firstterm(T) = ۲ *,(,‏ 
Firstterm(F) = { (, id‏ 


,(, id } 

id } 

j 

Lastterm(E) = {+,*,),id} 

Lastterm(T) = { *,), id} 

Lastterm(F) = { ), id } 

برای بدست آوردن رابطه علامت $ و سایر ahh‏ ها قاعده ای بفرم $ 8 $ ج × که 

در آن N‏ یک غیرپایانه جدید و ٩‏ علامت شروع گرامر است به گرامر اضافه می کنیم. 

حال با توجه به تعاریف روابط تقدم - عملگر که در بالا عنوان شد رابطه تساوی به 

شاد گی با بررسی قواعد بدست می آید.در گرامر قوق در نظر گرفتن قاعده جدیدی که 

bbe‏ علامت $ اضافه می گردد دو رابطه تساوی وجود دارد : $ = $ و )=( .توجه 

داشته باشید که ( = ) هیچ اطلاعی در مورد رابطه " ( " و " ) " به ما نمی دهد.مثلا از 
این نمی توان نتیجه گرفت که ) = ( . 

برای یافتن روابط > ,با توجه به تعریف OT‏ به دنبال نقاطی در گرامر می گردیم که یک 


پایانه در سمت چپ یک غیرپایانه قرار گرفته باشد.مثلا در قاعده پنجم این گرامر ۳) " 


سمت چپ غیرپایانه E‏ قرار گرفته است.حال اگر پایانه ای مثلا b‏ عضو مجموعه 
Firstterm(E)‏ باشد رابطه تقدم 0 > ) برقرار است.در واقع این رابطه بين "  )‏ و 
همه اعضا Firstterm(E)‏ برقرار است.یعنی در اینجا می توان نتیجه گرفت که روابط ( 
+< , *>) و)>) و10 > ) برقرار است.به همین ترتیب می توان سایر روابط تقدم 
> رانیز یافت. 

برای یافتن روابط > , با توجه به تعریف OT‏ به دنبال نقاطی در گرامر می گردیم که یک 
پایانه در سمت راست یک غیرپایانه قرار گرفته باشد.مثلا در قاعده پنجم این گرامر , ( " 


" 


سمت راست غیرپایانه E‏ قرار گرفته است.حال اگر پایانه ای مثلا 2 عضو مجموعه 
Lastterm(E)‏ باشد رابطه تقدم a>)‏ برقرار است.در واقع این رابطه تیف T)"‏ 
همه اعضا Lastterm(E)‏ برقرار است.یعنی در اینجا می توان نتجه گرفت که روابط 
)>+ , (<* , (<( و( <11 برقرار است.به همین ترتیب می توان ple‏ روابط 
تقدم < را نیز یافت. 


در نهایت جدول روابط تقدم گرامر فوق بصورت زیر خواهد بود.محل های خالی در 


جدول نشانگر OT‏ است که دو پایانه با هم رابطه ندارند.مثلا در اینجا id‏ با id‏ رابطه 


ندارد.این بدان معنی است که با استفاده از گرامر فوق نمی توان فرم جمله ای تولید نمود 
که در oT‏ دو id‏ مجاور هم قرار بگیرند.( در اینجا منظور از مجاور بودن دو BLL‏ این 
است که یا دقیقا مجاور باشند و یا اينکه بین آنها یک غیرپایانه باشد.توجه داشته باشید که 
به دلیل محدودیت خاصی که روی قواعد گرامر عملگر وجود دارد امکان ندارد که در 
یک فرم جمله ای دو SLL WE‏ مجاور هم قرار بگیرند.بنابراین حداکثر ممکن است بین دو 
پایانه یک غیرپایانه قرار داشته باشد که در اینصورت نیز Gb‏ تعریف OT‏ دو SLL‏ مجاور 


۳- ۳-۱1۵ اصلاح خطا در روش تقدم — عملگر 

در این روش کلا به دو صورت یک خطای نحوی تشخیص داده می شود.اول وقتیکه هیچ 

رابطه ای بین پایانه بالای انباره و ورودی جاری نباشد و دوم هنگامی که دستگیره بالای 

انباره با سمت راست هیچ قاعده ای تطبیق نکند. 

برای اصلاح خطاهای نوع اول در خانه JE ch‏ جدول نشانه روهایی به زیر روال های 

اصلاح خطا می گذاریم بطوریکه SV‏ در عمل تجزیه به یک خانه JE‏ جدول رجوع 

شده زیرروال مربوطه فراخوانی شده و خطا به نحو مقتضی اصلاح گردد. 

به عنوان نمونه گرامر زیر را در نظر بگیرید : EB ETE‏ 
(id‏ ۳ 

جدول تجزیه این گرامر بصورت زیر است : 


روال cl‏ اصلاح خطا بصورت زیر تعریف می شوند : 
"Fr angle‏ را حذف و پیغام " در ورودی یک پرانتز بسته اضافی وجود 
دارد ۲ را چاپ کن. 
ab: 2‏ "+" رابه ورودی اضافه و پیغام " یک عملگر در برنامه کم است 
" را چاپ کن. 
3 : پایانه " ) " را از بالای انباره حذف و پیغام " یک پرانتز بسته در ورودی 


کم است " را چاپ کن. 


در صورت تشخیص خطای نوع دوم یعنی عدم تطبیق دستگیره با سمت راست هیچیک از 
قواعد گرامر پارسر a‏ دنبال قاعده ای که سمت راست dead OT‏ دستگیره باشد ( در یکک با 


دو علامت تفاوت داشته باشند ( جستجو می کند و با توجه به اختلاف دستگیره و سمت 
راست قاعده پیدا شده play‏ مناسبی چاپ می کند و عمل کاهش را انجام می دهد. 

مثلا فرض LS‏ دستگیره AND‏ باشد و قاعده ای بصورت AEC)‏ ج ... ) پیدا شود.از 
آنجایی که غیرپایانه ها در این روش تجزیه اهمیتی ندارند و تنها محل آنها در انباره 
اهمیت دارد لذا در مقایسه دستگیره با سمت راست قواعد تنها به موقعیت BLL nb‏ ها 


اهمیت داده می شود.در این مثال با توجه به اینکه اختلاف دستگیره و سمت راست قاعده 


در LL‏ " 0 " است پیغام زیر صادر می شود.توجه داشته باشید که sla BLL‏ اضافی در 


دستگیره نشانه علائم اضافی در برنامه ورودی است. 


Illegal "b" on line.... 


حال اگر دستگیره بصورت ADEC‏ باشد و سمت راست قاعده پیدا شده بصورت 20۳06 
باشد پیغام زیر صادر خواهد شد : 


Missing "d" on line.... 


ممکن است اختلاف در مورد یک غیرپایانه باشد.بعنوان مثال فرض کنید ADC‏ دستگیره و 
60 سمت راست قاعده ای از گرامر باشد.دراینصورت صدور پیغامی بصورت " 
Missing "E" on line...‏ " مجاز نیست.زیرا کاربر یک کامپایلر اطلاعی در 
مورد غیرپایانه cle‏ گرامر ندارد و لذا در چاپ پیغامها نبایستی از غیرپایانه ها استفاده 
نمود.در این حالت بایستی با توجه به ساختار نحوی که غیرپایانه موردنظر توصیف می LS‏ 
درباره cles‏ کشف شده گزارش داد.مثلا اگر E‏ معرف یک عبارت جبری ( در ساده 
ترین شکل یک عملوند ) است می توان پیغام زیر را صادر نمود : 

Missing Operand on line.... 


توابع اولویت 


کامپایلر هایی که از تجزیه کننده های عملگر- اولویت استفاده می کنند » نیازی به ذخیره 
اولویت و g‏ که نماد cle‏ پایانه را به اعداد صحیح تبدیل می نمایند » کد گذاری شود. 


سعی بر این است که توابع ]و ع به گونه ای انتخاب شوند که برای هر نماد 2 و b‏ 


fla)< 2)0(-۱‏ هر گاه 0 > a‏ 
fla)= 8)0(-۲‏ هر گاه 0 = 2 
fla)> gb)-¥‏ هر گاه 9 < 2 


بنا بر این رابطه ی اولویت بین 2 و 0 می تواند توسط مقایسه ی عددی بین FA)‏ و gb)‏ 


انجام گیرد. به هر حال توجه داشته باشید که ورودی های خطا در ماتریس اولویت ‏ مهم 


می باشند. زیرا یکی از حالت های (۱) » (۲) و يا (۳) بدون توجه به این که fla)‏ و gb)‏ 
دارای چه مقادیری هستند » برقرار می باشد. فقدان توانایی آشکار سازی خطا e‏ عموما به 
اندازه ای مهم نیست که مانع استفاده از توابع اولویت در موقع لزوم شود. هنوز هم امکان 
گرفتن خطا در زمانی که کاهش درخواست می شود ولی دستگیره CHL‏ نمی گردد » 


وجود دارد. 


اینچنین نیست که هر جدول روابط اولویت ‏ دارای توابع اولویت به منظور کد گذاری OT‏ 


باشد ‏ اما در عمل »این توابع معمولا وجود دارند. 


مثال ) 
جدول اولویت زیر را در نظر بگیرید : 


> 


Re GS RENIN. BNE © 
Ree, KRONE NB NE Rp DN A 
۸ Rp OPE BENE OI Ms 
RE RSE I DR eR 


> 
> 
> 
> 
> 
> 
< 
> 
< 


برای مثال « 10 > * و FŒ) > gad)‏ . توجه داشته باشید که fid) > gad)‏ بیان می 
دارد که 10 > cid‏ اما در حقیقت هیچ رابطه ی اولویت بین sid‏ 14 وجود ندارد. ورودی 


های دیگر خطا در جدول اولویت بالا به طور مشابه با یکی از روابط اولویت جایگزین می 


گردند. روشی ساده به منظور یافتن توابع اولویت برای یک جدول » اگر چنین توابعی 


الگوریتم ساخت توابع اولویت: 
ورودی : ماتریس عملگر- اولویت 


خروجی : توابع اولویت نمایانگر ماتریس ورودی» با نشان دهنده این است که چنین 


جدولی وجود ندارد. 

روش: 

۱- نماد Gay fa‏ را برای هر 2 که یک پایانه با $ است ایجاد نمایید. 

۲- نماد cla‏ ایجاد شده را به تعداد ممکن گروه تقسیم بندی کنید به شکلی که اگر 
a=b‏ در این صورت Bb fa‏ در یک گروه قرار می گیرند. توجه داشته باشید که ممکن 
است مجبور شوید نمادهایی را در یک گروه قرار دهید» حتی اگر با رابطه ی = با 
یکدیگرمرتبط نشده باشند. برای مثال اگر cHbsa=b‏ انگاه wb fe sfa‏ در یک گروه 
قرار گیرند» زیرا هردوی آنها در همان گروه 20 قرار دارند.اگر علاوه بر آن0<0 آنگاه 
sfa‏ 20 در یک گروه قرار دارند حتی اگر 220 وجود نداشته ASL‏ 

۳- گراف جهت داری ایجاد کنبد که گره cla‏ آن» گروه های ایجاد شده در مرحله ۲ 
باشند. برای هر 4و0 اگر 2 آنگاه یک لبه از گروه agb‏ گروه f‏ رسم کنید.اگر a>b‏ 
انگاه یک لبه از گروه 18 Bba‏ رسم نمایید. توجه داشته باشید که یک لبه یا مسیر از fa‏ 
به gd‏ به این معنی است که Lb fa‏ بیش از (2)0 باشد؛یک مسیر از fa agb‏ به این 
معنی است که Eb)‏ باید بیش از f(A)‏ باشد. 

۴- اگر کراف بدست آمده در ۳ دارای دوره باشد.‌توابع اولویت و جود ندارند. اگر دوره 
وجود نداشته باشد .مقدار fla)‏ « طول طولانی ترین مسیری است که از گروه 13 شروع 
می شود مقدار Ba‏ طول طولانی ترین مسیر از گروهی است که Ba‏ در OT‏ قرار دارد. 
مثال: 


ماتریس زیر را در نظر بگیرید : 


در این ماتریس هیچ رابطه = وجود ندارد ‏ بنابراین هر نمادهبا خودش در یک گروه است. 
شکل زیر گراف بدست آمده با الگوریتم بالا را نشان می دهد. 


در این گراف دوره وجود نداردهبنابراین توابع اولویت وجود دارند. از آنجایی که 18 و 


5 لبه ی خروجی ندارند»0-(8۵)8-(8]. طولانی ترین مسیر از chlo Bt‏ طول 1 
است.بنابراین 1-(8)1 . یک مسیر از gid‏ به "لو *ع fry‏ و +ع و 13 وجود cb slo‏ 


بنابراین 5-(8)10.توابع اولویت نتیجه عبارت اند از: 


10 
4 


۱۶-۳ روش تجزیه تقدم ساده 
& رز 3 & “ e‏ ی “ pd‏ ۷" مره 
این روش تجزیه بسیار شبیه روش تجزبه تقدم — عملگر است و در واقع بهبود يافته تقدم = 


عملگر است.در این روش روابط تقدم بین همه عناصر گرامر تعریف شده در ARS‏ در 


تقدم - عملگر این روابط فقط بین پایانه ها تعریف می شود.برای استفاده از این روش 


محدودیت های کمتری نسبت به مورد تقدم - عملگر وجود دارد که باعث می شود که 
روش تقدم ساده ab‏ ب fleets‏ گرآمرها زا در رکرو lee‏ نمونه در Gehl‏ وجود 
غیرپابانه های مجاور در سمت راست قواعد مجاز است لیکن مانند حالت قبل وجود قواعد 
اپسیلون مجاز نیست.از آنجا که در روش تقدم ساده بر BIE‏ روش تقدم - عملگر بین 
غیرپایانه ها تمایز قائل می شویم .در اینجا یک محدودیت جدید داریم که سمت راست 
هیچ دو قاعده ای sls‏ بکسان باشد زیرا در غیراینصورت در بعضی از قدم ها تداخل 
کاهش - کاهش پیش خواهد آمد.البته این محدودیت چندان مهمی نیست.در هر دو مورد 
این روشها یک محدودیت ES pia‏ وجود دارد که در خانه cle‏ جدول تجزیه بایستی 
حداکثر یک رابطه تقدم وجود داشته باشد. 

در روش تقدم ساده هم برای هدایت عملیات از روابط سه گانه تقدم استفاده می شود.البته 
در روش تقدم ساده این روابط بین کلیه علائم گرامر ( پایانه و غیرپایانه و 5 ) تعریف می 
شود.جدول تجزیه تقدم ساده یک جدول مربع است که به تعداد حاصل جمع تعداد ALL‏ 
ها و غیرپایانه های گرامر بعلاوه یک ( بخاطر علامت $( سطر وستون دارد. 

برای تعیین روابط تقدم ساده از توابع با نامهای Head‏ و Tail‏ استفاده می شود که 
تعریف رسمی آنها بصورت زیر است ( هر دوی این توابع بر روی یک غیرپایانه عمل 
کرده و حاصل آنها مجموعه ای از علائم گرامر است ) : 


Head(U) = ۱ US Xa } 
Tail(U) = {X | U 5 aX } 


: با استفاده از دو تابع فوق روابط تدم ساده بصورت زیر تعریف می شوند‎ 
iff OU-...XY... 
iff OU—-... XA... and Y € Head(A) 
iff QOU-...AB... and X€Tail(A) 
and Y € Head(B) or Y=B 


به عنوان مثال گرامر زیر را در نظر بگیرید : 


S—(SS) 
S ب‎ ۵ 
ج لا به قواعد گرامر اضافه‎ $ ٩ $ مانند روش تقدم - عملگر ابتدا قاعده ای بفرم‎ 


کرده سپس مطابق روالی که در آنجا ذکر گردید به دنبال قواعدی می گردیم که شرایط 
تعاریف فوق در مورد آنها صدق نماید.حاصل این کار در مورد مثال فوق بصورت جدول 
تجزیه زیر خواهد بود.برای تفکیک روابط تقدم ساده از روابط تقدم - عملگر , روابط 


تقدم ساده L‏ استفاده از علائم متفاوتی نمایش داده خواهد سك 


رک 
)ك 
9 
9 
© 


) 
© 
9 
9 


3 
> 
3 
5 


$ 
Ə 
9 
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۱۶-۳ - ۱الکوریتم تجزبه به روش تقدم ساده 
در این روش پارسر در هر قدم از تجزیه با استفاده از ت وکن جاری D‏ و عنصر SVL‏ انباره 
× ( که می تواند پایانه یا غیرپایانه باشد ) به جدول تجزیه مراجعه کرده و بصورت یکی 
از CVE‏ زیر عمل می کند : 
۱. در صورتی که رابطه علامت CVE‏ انباره و توکن جاری بصورت 0 O‏ × 
باشد پارسر عمل انتقال را انجام می دهد.در این مورد ابتدا علامت (5) و 
سپس توکن جاری 0 را به بالای انباره منتقل می کند. 
5s‏ یتیک واه دوعسم و Sy jaw‏ ری کر ay‏ اس رفظ 
ت وکن جاری را به بالای انباره انتقال می دهد. 
۳ در صورتیکه رابطه بصورت b‏ (<) × باشد پارسر عمل کاهش را انجام می 
دهدن این تعالت دس گیر رنه بالای Cantal‏ اول عاد اس بارشر 
ابتدا دستگیره را از CYL‏ انباره حذف می کند.ا گر عنصر بالای انباره ( پس از 


OT بنامیم و سمت چپ قاعده ای را که پارسر از‎ Top دستگیره ) را‎ Cade 


جهت کاهش استفاده می کند LAs‏ بنامیم پارسر رابطه بین Lhs‏ و Top‏ را 
از جدول استخراج نموده و یکی از اعمال زیر را انجام می دهد : 
© اگر رابطه Top‏ و Lhs‏ بصورت Top © Lhs‏ باشد پارسر ابتدا 
Lhs paws tase‏ را وارد انباره می AST‏ 
© اگر رابطه Top‏ و Lhs‏ بصورت Top ©) Lhs‏ باشد پارسر فقط 
Lhs‏ را وارد انباره می AS‏ 
۰ اگر Top‏ و Lhs‏ رابطه ای نداشته باشند یک خطای نحوی رخ داده 
است و بایستی رویه اصلاح خطا فراخوانده شود. 

۴ در صورتی که عنصر بالای انباره X‏ و ورودی cole‏ 0 رابطه ای نداشته 
باشند EK‏ خطای نحوی رخ oala‏ است و بایستی رویه اصلاح خطا فراخوانده 
شود. 

3 در صورتی که توکن جاری $ و در داخل انباره S) $S‏ علامت شروع 
گرامر است ) SL‏ مانده باشد پارسر پایان موفقیت آمیز تجزیه را اعلام می 
eS‏ 


T- 17-7‏ مشکلات چپ گردی و راست گردی در روش PAB‏ ساده 

هر گاه در قواعد گرامر وضعیتی بصورت زیر باشد که در OT‏ قاعده اول یک قاعده 

چپ گرد است بین علامت X‏ و غیرپایانه U‏ دو رابطه تقدم بصورت زير وجود دارد: 

U-U... 

VS XU 

xX UK OOD 

برای حل این مشکل قواعد فوق را بصورت زیر تبدیل می کنیم که در آن ۷۷ یک 
غیرپایانه جدید است : 

U—>U... 


V—... XW... 
W— U 


حال روابط تقدم بین این علائم بصورت زیر است : 

۲) ۷ , XQu 
قاعده اول یک‎ OT همچنین هرگاه در قواعد گرامر وضعیتی بصورت زیر باشد که در‎ 
: دو رابطه تقدم وجود دارد‎ X و علامت‎ U غیرپایانه‎ Ge قاعده راست گرد است‎ 


ل] ... + لا 
UX...‏ سب ۷ 


برای رفع این مشکل قواعد را بصورت زیر تغیبر می دهیم : 


U-...U 

Vo... WX... 

W— U 

در ادامه به عنوان یک نمونه از تجزیه به روش تقدم ساده به تجزیه جمله (C(CC))‏ 


تو جه کنید : 


عمل انجام شده ورودی 


$ (ES تال‎ 


$ > ) c(cc))$ انتقال‎ 


8 > )> 6 (cc))$ 


$<(S (cc))$ 
$ > ) <( c))$ تة‎ 


$<(5<(<c ))$ 


$<(S<(S ))$ 


$<(S<(S<ce ))$ 


$<(S<(SS ))$ 


$<(S<(SS ۳ S ج‎ (SS) کاهش بوسیله‎ 


$<(SS ۳ انتقال‎ 


$<(SS) $ S — (SS) کاهش بوسیله‎ 


$ S $ پایان‎ 


روشهای تجزیه LR‏ 
یکی از امن ترین روشهای تجزیه پائین به بالا که می تواند در مورد اکثر گرامرهای 
مستقل از متن اعمال شود روش LR‏ است.مزایای روشهای تجزیه LR‏ عبارتند از : 

با ale‏ ما رهام رای اه ی وا وان ER agate‏ 
تشخیص داد. 

۲- روش تجزیه IS LR‏ ترین روش تجزیه غیر با زگشتی به طریقه انتقال - کاهش 
است که تا کون شناخته شده و می توان OT‏ را به کارایی هر روش دیگری پیاده 
سازی کرد. 

۳- مجموعه زبانهایی که توسط روش LR‏ تجزیه می شوند شامل مجموعه زبانهایی 
است که توسط پارسرهای پیشگو تجزیه می شوند. 

۴- یک پارسر LR‏ خطای نحوی را در کمترین زمان توسط بررسی چپ به راست 


ورودی پیدا می AS‏ 


تجزیه LR‏ خود از سه روش زیر تشکیل می شود : 


1. SLR ( Simple LR ) 
2. LALR ( Look Ahead LR ) 
3. CLR ( Canonical LR ) 


یکی از معایب روش OT LR‏ است که حجم کار بسیار زیادی دارد که در مورد پیاده 


سازی دستی آن را مشکل می نماید ولی به هر حال نرم افزارهای خود کاری وجود 


ساختار پارسرهای LR‏ به فرم زیر است : 


Output 


action 


الکوریتم تجزیه LR‏ 
اگر در حال حاضر XSm> Baie <<< and ) (Bua Se‏ ...262 2و٩‏ )را داشته 


باشیم یعنی اینکه پارسر LR‏ در قدمی از تجزیه قرار گرفته باشد که شماره وضعیت بالای 


پشته Sin‏ و توکن جاری :8 باشد.بنابراین در این حال پارسر به خانه [ aj‏ و action [ Sm‏ 
رجوع می کند اگر این خانه خالی نباشد یکی از سه حالت زیر رخ می دهد : 

1. Shift 2. Reduce A > a 3. Accept 
از رشته ورودی حذف‎ 2: Sy paul باشد در‎ action ] Sm , a; ] = ShiftS 1-1 
روی آن قرار می گیرد.‎ S می شود و سپس وضعیت‎ Push, Stack شده و به‎ 

۲-اگر action ] Sm , ai [ = Reduce A > a‏ باشد در آنصورت پارسر عمل 


کاهش را انجام می دهد و از پیکربندی 
Bese Kni aidi+1 ... An $)‏ 6 


به پیگربندی ) $ Aaj] ... an‏ و So.X191X292 watt KEES AS‏ ( دست 
خواهیم یافت که در آن : 


ل 0 [ S= goto ] Smr, A‏ 
بنابراین تعداد حروف حذف شده از Stack‏ به اندازه 21 خواهد بود که T‏ به تعداد 


وضعیتها یا تعداد علائم گرامر A‏ است. 
۳- اگر action ] Sma; [ = accept‏ باشد در اینصورت عمل پارس به شکل موفقیت 


action [| Sm,ai | BA‏ خالی باشد oles ER‏ نحوی رخ داده است که در این حال 


)5 4 خطاپرداز فراخوانی می شود. 

قرارداد : منظور از 1 در جدول پارس , به منظور عمل کاهش ( (reduce‏ توسط قانون 
شماره N‏ است و منظور از Sy‏ یعنی انتقال با Cul Shift‏ که 1 شماره یک وضعیت می 
باشد. 


مثال - گرامر زیر را در نظر بگیرید : E>E+T‏ 
E-T‏ 

T—T*F 

T—-F 

F — id 


State | id 


0 S5 


\O | 00 | ل‎ | VJ |] AI وه | دیا‎ | 


مس 
| ب 


Input Action 

0 id*id+id $ Shift 

0115 *id+id $] Reduce by F — id 
0۳3 ۴10710 $| Reduce by T — F 
012 *idtid $ Shift 
0T2*7 id+id $ Shift 
0T2*7id5 +id 5 | Reduce by F —> id 
0T2*7F10 +10 $| Reduce by T > T*F 
0T2 +id$| Reduce by E —> T 
0۳1 +10 $ Shift 
0E1+6 id $ Shift 
0۳/15 $| Reduce by F — id 
0E1+6F3 $, Reduce by T — F 
0E1+6T9 $ E — E+T 
0۳1 $ Accept 


نحوه تهیه جدول SLR)‏ : 
در Ole‏ سه روش LR‏ ساده ترین روش از نظر پیاده سازی روش Simple LR) SLR‏ ( 
است.قبل از توضیح راجع به نحوه بدست آوردن جدول (51۸)1 SS‏ چند مفهوم زیر 
ضروری است : 

1 یک آیتم LR(O)‏ یک قاعده از گرامر است که در محلی درسمت 


OT Cul,‏ یک Cade‏ خاص صفر point L‏ وجود داشته باشد.مثلا 


اگر قاعده ای به شکل زیر داشته باشیم 7 — olge A‏ از روی 


آن 4 آیتم زیر را بدست آورد : 
A — .xyZ‏ 
A — 7‏ 
A — Xy.Z‏ 
A — xyz.‏ 
۲ اگر قاعده € داشته باشیم یعنی 6 ج ۸ تنها آیتم ما . ج ۸ است. 


تعریف Closure( I)‏ : اگر 1 یک مجموعه از آیتم های یک گرامر باشد در 
آنصورت Closure( I)‏ را I) ju.‏ ) می نامیم که OT‏ نیز یک مجموعه از آیتم 
هاست و برای محاسبه OT‏ بایستی دو قدم زیر ly‏ ی AS‏ 

۱- هر آیتمی که در [ وجود دارد را به )1( Closure‏ می افزائيم . 

۲- اگر قاعده ای به شکل ۵.88 + A‏ در بستار 1 داشته باشیم و 8 ج 8 یک 


قاعده از گرامر باشد آنگاه قاعده 8. ج 8 رابه بستار 1 می افزائیم. 


رسم دیاگرام انتقال SLR‏ : 
همانطوری که گفته شد برای تهیه جدول تجزیه روشهای LR‏ بایستی یک دیا گرام انتقال 


رسم کرد.این امر در مورد روش SER)‏ به شکل زیر خواهد بود : 


۱. ابتدا قاعده ای به شکل S'S‏ که در آن S‏ علامت شروع گرامر است 
و ٩‏ یک nonterminal‏ جدید است اضافه می کنیم.به این گرامر یک 
گرامر افزوده گوئیم. 

. رسم دیاگرام را با وضعیت م[ و آیتم S'S‏ شروع می کنیم و سپس 
بستار این آیتم را محاسبه کرده و در Ip‏ قرار می دهیم.سپس درصور تیکه 
در حالت Ip‏ یا بطور US‏ در حالت :1 باشیم آیتم ols‏ که به شکل زیر 
اند که در آنها × می تواند یک ALL‏ با غیرپایانه باشد وجود دارد. 


Ay ج‎ a. XB, 
A> => a2. X B2 
An > 02 


با بوجود آمدن وضعیت جدید li‏ میتوان li‏ را توسط لبه هایی با برچسب X‏ به ز1 متصل 
نمائیم و پس از اینکه در همه عبارات علامت نقطه را به بعد از علامت X‏ منتقل کردیم 
در وضعیت جدیدی قرار خواهيم گرفت.بدین ترتیب آنقدر این عمل را ادامه می دهیم تا 
دیگر حالت جدیدی به دیا گرام اضافه نشود. 


E—E+T|T 
To ] * ۲ | ۲ 
۲ -« )۲ (0 


تهبه جدول تجزیه از روی دیاگرام SLR(D)‏ : 
پس از رسم دیاگرام SLR(1)‏ یک گرامر جدول تجزیه آنرا بصورت زیر تکمیل می 
نمائیم : 

۱. نحوه پر شدن بخش ACTION‏ 

۱-۱. اگر با ورودی a‏ از وضعیت 1 به وضعیت J‏ برویم در خانه action[La]‏ دستور 

۲-۱. اگر در حالت 1 آیتمی بفرم AO.‏ داشته باشیم در اینصورت به ازای هر € 4 
st Follow(A)‏ با شماره قاعده مذ کور را در 0 — action[I,a] = reduce A‏ 
در حدول قرار می دهیم. 

کر در حالت 1 آیتمی بفرم S.‏ ج atl S!‏ باشیم در آنصورت در خانه 
action[I,$]‏ علامت Accept‏ قرار می دهیم. 

۴-۱. در خانه JL cl‏ بخش action‏ علامتی را بعنوان خطا میتوان قرار داد. 


۲ نحوه پر شدن بخش 28010 : 


برای پر کردن بخش goto‏ از جدول تجزیه بدین ترتیب عمل می کنیم که اگر با 


.goto[I,A] =J cx 


E—E+T|T 
TTF 
F—F*|a|b 


م بت | نا دنا BI‏ | ها A}‏ | لب | 06 


Follow(T)={$,+,a,b} 
Follow(F) = {*,$,+,a,b} 
Follow(E) = {$,+} 


این گرامر SLR)‏ است. 


© 


س وه | دیا VJ My BY]‏ | ل | م۵ | \O‏ 


این گرامر SLR(1)‏ نیست. 


دیا گرام Jove‏ تجزیه CLR‏ و LALR‏ : 
یک روش برای تهیه دیاگرام LALR‏ از طریق رسم دیاگرام CLR‏ است.برای این 
منظور مفهوم آیتم cle‏ (1.15)1 را تعریف می کنیم. 
یک آیتم LRU)‏ عبارتست از یک زوج مرتب متشکل از یک آیتم LRO)‏ و یک 
مجموعه از پایانه ها ply‏ مجموعه پیش بینی و معمولا این آیتم را به شکل کلی 
(A > 0.۳ , LA )‏ نمایش می دهیم.رابطه بین مجموعه پیش بینی LA‏ و مجموعه 
Follow‏ غیرپابانه A cl‏ به شکل زیر است : 

LA 6 Follow(A) 


الگوریتم محاسبه تابع بستار در مورد الگوریتم تابعهای Ss LR(1)‏ مشابه الگوریتم 
محاسبه بستار آیتم LR(0)‏ است. در مورد آیتم ] >a. 8 8 , {a}‏ ۸ ] چنانچه 


S‏ — 8 یک مجموعه از قاعده گرامر باشد در اینصورت مجموعه پیش بینی زیر را می 


: افزائیم‎ 
[B—.S, {b} ] b € First(Ba) 


: CLR pt bo رسم‎ 4% sb 
است با این تفاوت که برای شروع قاعده‎ SLR مشابه دیاگرام‎ ids CLR رسم دیاگرام‎ 


٩ .S,$ ]‏ ] را بعنوان آیتم LR(1)‏ به مجموعه قواعد گرامر اضافه می کنیم. 
مثال : 


1 S — CC 

0 ب ) 23 

a=$ First(Ba) = First($) 

B=S {$} 

a=€ ب و‎ CC 

S'=A [S—.CC,$] [C—.cC,c|d] 
B=: A — a.Bß,a 


C > c.C,c|d 
C 0ب‎ 
C > .d,c|d 


نحوه تشکیل جدول CLR(1)‏ : 

روش تهیه جدول CLR(1)‏ دقیقا مطابق جدول Col SLR(1)‏ با این تفاوت که در 
اینجا در وضعیت I‏ اگر آیتمی به فرم [ {b}‏ , .0 ج atl [A‏ باشیم آنوقت در خانه 
action[I,b] ck‏ شماره دستور 0 > Reduce A‏ را قرار می دهیم یعنی در اینجا 
از Follow‏ ها کمک نمی گیریم. 


© 


1 
2 
3 
4 
5 
6 
7 
8 
9 


رسم دیا گرام و جدول تجزیه LALR‏ : 

برای رسم دیا گرام LALR‏ ابتدا دیا گرام CLR‏ را ترسیم کرده و سپس وضعیتهای این 
دیاگرام را به شکل زير ادغام می کنیم.بدین ترتیب که در وضعیتهای متفاوتی که pul‏ 
های LR(O)‏ آنها یکسان است و علامت پیش بینی آنها متفاوت است آنها را یکی فرض 
می نمائيم و بخش پیش بینی آنها را به شکل اجتماع پیش بینی های دو وضعیت در نظر می 


oe 


مثال - برای مثال قبل وضعیتهای 7,4 و 8,9 و 3,6 یکی می شوند. 


C > 8 


Igo 


136 
C > c.C,cld|$ C > 05 
C => .cC,cld|$ 


C > .d,c|d|$ 


برای مثال قبل تغییرات را اعمال می کنیم. 


C 
2 


0 
1 
2 


36 
47 
5 
89 


اگر گرامری CLR‏ باشد و پس از بدست آوردن جدول تجزیه LALR‏ تداخلی بوجود 
نیاید میتوان نتیجه گرفت که گرامر LALR‏ است. 

اگر گرامری CLR‏ باشد ولی LALR‏ نباشد پس از ادغام در جدول تجزیه SILALR‏ 
گرامر ممکن است تداخل نوع کاهش - کاهش رخ دهد. 


توجه : در جدول LALR‏ هیچ وقت تداخل انتقال — کاهش رخ نمی دهد مگر آنکه 
گرامر از نوع CLR‏ نباشد. 


Head(s)={(,c } 
Tail(s)={),c} 
iff 9 U-... XY... 
iff 3 U—-... XA... and Y € Head(A) 
iff 9 U-... AB... and XE Tail(A) 
and Y € Head(B) or Y = B 


فشر od‏ سازی جداول تجز به DLR‏ 

یک روش مفید به منظور فشرده سازی فیلد ACTION‏ تشخیص این نکته است که اغلب 
تعداد زیادی از سطر های جدول action‏ مشابه هستند. بنا بر این در زمان کوتاه امکان 
صرفه جویی LE‏ توجه در حافظه وجود خواهد داشت. اشاره گر ها برای حالت ola‏ که 
action‏ مشابه دارند. به مکان مشابه اشاره می کنند. به منظور دسترسی به اطلاعات این 
آرایه به هر پایانه یک عدد بین صفر تا یک واحد کمتر از تعداد پایانه ها نسبت می دهیم» 
و این عدد صحیح را به عنوان تفاوت مکان از محلی که مقدار اشاره گر برای هر حالت 
مشخص می کند» مورد استفاده قرار می دهیم. برای یک Se‏ داده شده عمل action‏ 
در تجزیه برای پایانه celi‏ در 1 محل بعد از محل اشاره گر برای آن حالت» به دست می 
آید. 

علاوه بر آن» کارایی بیشتر حافظه می تواند در مقابل تجزیه کند تر به دست eT‏ این عمل 
با ایجاد یک لیست برای chaction‏ هر حالت بدست می آید. ای لیست شامل زوج 


(نماد (action « all‏ باشد. متداول ترین action‏ برای یک Se‏ می تواند در 


انتهای لیست قرار گیرد و به جای یک پایانه ممکن است کلمه ی ANY‏ را قرار دهیم. به 
این معنی که اگر نماد ورودی جاری تا کنون در لیست یافت نشده است. این action‏ 


بايد بدون توجه به ورودی انجام شود.علاوه بر این وارده cle‏ خطا می توانند به منظور 
یکنواختی بیشتر در یک سطر با 100166جایگزین شوند. این خطا ها بعدا قبل از یک 
حرکت انتقال آشکار خواهند شد. 

مقال - جدول تجزیه زیر را در نظر بگیرید: 


نخست به این نکته توجه نمایید که بخش 201108 از cl Se‏ 0,4,6,7 با یکدیگر 
مشابه می باشند. همه ی OT‏ ها را می توان با لیستی به صورت زیر نمایش داد: 


عمل 


حالت ۱ نیز لیستی مشابه دارد: 


S6 
Acc 
Error 


در حالت ۲ تمامی وارده های خطا را می توان با 12 جایگزین نمود: 
S7‏ 
R2‏ 


و برای حالت ٩‏ به صورت: 

= S7 

any R1 
را نیز می توان با استفاده از یک لیست کد گذاری نمود. اما به نظر می رسد‎ BOLO جدول‎ 
کارایی بیشتری داشته باشد. هر‎ A ساخت یک لیست از زوج ها برای هر غیر پایانه مانند‎ 
زوج در این لیست برای غیر پایانه ۸ به شکل (حالت بعدی » حالت جاری) می باشد که‎ 
2010|] بعدی-[ ۰۸ حالت جاری‎ Se نشان دهنده:‎ 
می باشد.‎ 
که به وارده های خطا در بخش‎ ASL فضا به این نکته توجه داشته‎ pty به منظور کاهش‎ 
از جدول هرگز مراجعه نمی شود. به این ترتیب هر وارده خطا را می توان با‎ 0 
خطا در همان ستون جایگزین نمود.‎ pb متداول ترین حالت‎ 


مثال - جدول تجزیه مثال قبل را در نظر بگیرید. ستون مر بوط به F‏ برای حالت ۷ مقدار 


۰ را دارد» و تمام وارده های دیگر مقدار ۳ يا خطا دارند» می توان خطا را با مقدار ۳ 


جایگزین کرد و برای ستون F‏ لیستی به صورت زیر ایجاد کرد: 


به طور مشابه برای ستون T‏ داریم: 


استفاده از اولویت و شر کت Sp‏ به منظور رفع تناقض های بخش 
action‏ : 


گرامر زیر برای عبارت های محاسباتی» با عملگر های ۰-۳ * مبهم است زیرا شرکت 


: را تحص نم گنه‎ Coal ice oi 


E **** E+E | E*E |(E) | id 

گرامر غیر مبهم زیر همان زمان را تولید میکند اما به + اولویت کمتری از * می دهد و هر 
دو عملگر را با شر کت پذیری چپ تعریف می AS‏ 

E E+T |T 

T T*F | F 

F (E) | id 

دو دلیل وجود دارد که از گرامر اولی بجای دومی استفاده می شود: 

۱- تجزیه کننده گرامر دوم زمان زیادی را صرف کاهش با مولد های ۳ 1 , 1 ۳ می 
sits‏ 

۲- به راحتی می توان شر کت پذیری و اولویت را برای She‏ های t,*‏ بدون اضافه 
کردن تعداد حا لت ها در گرامر تعریف کرد. 

شکل زیر مجموعه 011آهای LR(0)‏ را برای گرامر 


E **** E+E | E*E |(E) | id 
آن اضافه شده نشان می دهد.‎ a E` E که‎ 


15: 

E E* .E 
E .E+E 
E .E*E 
E .(E) 
E id 


16: 
E (E.) 
E E+E 
E E.*E 


I7: 
E E+E. 
E E.+E 
E E.*E 


I8: 
E E*E. 
E E+E 
E E.*E 


16: 
E (E). 


10 : 
E.E 
E .E+E 
E .E*E 
E .(E) 


E (E) 
E .E+E 


EE 


E .(E) 
E id 


13: 
E id. 


14: 

E E+.E 
E .E+E 
E .E*E 
E .(E) 
E .id 


از OT‏ جایی که این گرامر مبهم است» هنگام تولید جدول تجزیه LR‏ تناقض هایی در 


بخش action‏ ایجاد خواهد شد. حالت هایی مشابه 17 و18 این تناقض ها را تولید می 


ues:‏ اک از روش SLR‏ برای ایجاد جدول تجزیه استفاده کنیم تناقض ایجاد شده 


توسط 17 بین کاهش با E EHE‏ و انتقال با + و* قابل حل نیست. زیرا + و* هر دو در 
follow(E)‏ قرار دارند. بنابر این هر دوی این action‏ ها در صورت در CSL‏ ورودی 
های و* فرا خوانی خواهند AS‏ 

برای مثال ورودی Lidtid*id‏ در نظر بگیرید.در نهایت به حالتی می رسیم که در پشته 
07 و در ورودی *id$‏ داریم. فرض LS‏ * نسبت به جمع اولویت داشته 
باشد» تجزیه کننده باید * را به پشته منتقل کند و برای کاهش با * و 10های طرفین OT‏ 
آماده شود. این همان چیزی است که تجزیه کننده SLR‏ انجام می دهد. و همان چیزی 
است که یک تجزیه کننده عملگر- اولویت انجام می دهد. اگر + اولویتی بالا تر از * 
داشته باشد» تجزیه کننده EFE‏ را به E‏ کاهش خواهد داد. بنا بر این اولویت نسبی جمع 
که بعد از ضرب می باشد. به طور منحصر به فرد مشخص می سازد که چگونه تناقض 
0 در تجزیه بین کاهش E EHE L‏ و انتقال با * در Se‏ ۷ برطرف خواهد شد. 
اگر به جای ورودی قبلی مقدار 10۳1010 a‏ عنوان ورودی باشد» پس از پردازش بخش 
60 تجزیه کننده به وضعیتی خواهد رسید که در OT‏ محتوای پشته OEI+4E7‏ 
خواهد بود. با ورودی + مجددا در حالت 17 تناقض انتقال - کاهش وجود خواهد داشت 
به هر حال شرکت پذیری عملگر+ مشخص خواهد کرد که این تناقض چگونه باید حل 
شود. اگر + شر OS‏ پذیری چپ داشته باشد action‏ صحیح» کاهش Jal Ea EHE‏ 
بود. 

فرض US‏ + شرکت پذیری چپ داشته باشد» در حالت ۷ 2011010 با ورودی ۳ باید 
کاهش با tel E E+E‏ و فرض کنید که * اولویت بیشتری نسبت به جمع داشته باشده 
سور حالت ۷ با ورودی * انتقال خواهد بود. 

به طور مشابه فرض کنید * شرکت پذیری چپ دارد و اولویت OT‏ بالا تر از + می باشد» 
ne te a‏ 
به ازای هر دو ورودی و* انجام دهد و این که این حالت فقط زمانی در بالای پشته قرار 
می گیرد که E*E‏ سه نماد CYL‏ پشته باشند. در رابطه با دلیل OT‏ این است که * 


اولویتی بالاتر از + دارد» در Se‏ که در مورد * علت OS pb‏ پذیری چپ * می باشد. 


با ادامه این روش جدول تجزیه LR‏ به شکل زیر به دست می آید: 


جدول های نماد 

کامپایلر از جدول نماد برای نگهداری اطلاعات و محدوده تعریف نام های برنامه استفاده 
می نماید . هر زمان نامی در متن برنامه Cab‏ می شود جدول نماد جستجو می گردد . 
هنگامی که نام جدیدی يا اطلاعات جدیدی در رابطه با نام های موجود در جدول یافت 
شود » جدول تغییر می نماید . 

مکانزيم جدول نماد LL‏ این امکان را فراهم سازد که اضافه نمودن وارده های جدید و 
جستجوی وارده های موجود به صورت SAT IF‏ انجام گیرد . دو مکانیزم جدول نماد که 
در این بخش ارائه شده است » لیست های خطی و جدول در هم می باشند . هر یک از این 
طرح ها بر مبنای زمان لازم جهت افزودن n‏ وارده و انجام e‏ در خواست بررسی می 


گردند .لیست خطی cp SLT‏ آن ها برای سا غت می باشد . اما زمانی که Con‏ به سمت 


مقادیر بزرگ میل کنند کارایی کاهش می یابد . طرح های درهم کارایی بهتری را با 


فعالیت برنامه نویسی و صرف فضای بیشتر ارائه میدهند . هر دو روش می توانند به گونه 
ای سا زگار شوند که بتوانند اکثر قوانین محدوده برنامه را اداره نمایند . 

برای کامپایلرمفید است که بتواند در صورت لزوم در زمان کامپایل اندازه جدول نماد را 
به صورت پویا افزایش دهد . اگر در زمان نوشتن کامپایلر ‏ اندازه جدول نماد ثابت باشد » 
اندازه OT‏ باید به اندازه کافی بز رگ انتخاب شود تا بتواند هر برنامه مبدا ممکن را اداره 


نماید . این چنین اندازه ثابتی برای اکثر برنامه ها بسیار بز رگ و برای بعضی نامناسب است. 


03519 های جدول نماد 

هر وارده در جدول نماد » برای اعلان نام است SB.‏ يا شکل وارده ها لزومی ندارد که 
یکنواخت باشد » زیرا اطلاعات ذخیره شده برای نام » به استفاده از آن نام بستگی دارد . هر 
وارده می تواند به عنوان رکوردی که شامل دنباله ای از کلمات متوالی حافظه است ¢ پیاده 
سازی شود . به منظور حفظ یکنواختی ر کوردهای جدول نماد » بعضی از اطلاعات مربوط 
به نام مناسب تر است که درخارج ازاین وارده جدول نگهداری شوند و تنها یک اشاره گر 
به اطلاعات ذخیره شده در این رکورد » قرار داده شود . 

اطلاعات در زمان cla‏ متفاوتی به جدول نماد وارد می شوند . کلمات GANS‏ در ابتدا به 
جدول وارد می شوند . تحلیل گر لغوی ‏ دنباله ای از حروف و ارقام را درجدول نماد 
جستجو می نماید تا مشخص شود که یک کلمه کلیدی و یا نام تشخیص داده شده است . 
دراین روش » کلمات کلیدی قبل از اینکه تحلیل گر لغوی کار خود را آغاز نماید » باید 
در جدول وجود داشته باشند . در مقابل » اگر تحلیل گر لغوی در ضمن کار کلمات 
کلیدی رزرو شده را تشخیص می دهد نیازی به حضورآنها در جدول نماد نمی باشد . 
obj E‏ کلمات کلیدی را رزرو نکند» لازم است که کلمات کلیدی به جدول وارد شوند 


با این هشدار که امکان استفاده آنها به عنوان کلمه کلیدی وجود دارد . 


هنگامی که نقش یک نام روشن شود وارده ای از جدول نماد می تواند به OT‏ اختصاص 


داده شود و به محض اینکه اطلاعات مربوط به OT‏ در دسترس قرار گرفت polis‏ صفت 


OT‏ وارده در جدول تکمیل می گردد .در برخی از موارد » به محض اینکه تحلیل گر لغوی 
نام را در ورودی دید وارده ای برای OT‏ در جدول نماد اختصاص می دهد اغلب اوقات » 
یک نام می تواند مشخص کننده چندین شیء باشد حتی در یک ES gh‏ یارویه . برای 
مثال اعلان های C‏ به صورت : 

(۱- الف) 


Int x; 


Struct x { float y , z ;} 


× را هم به عنوان متغیر وهم به عنوان یک ساختار با دو فیلد معرفی می نماید . درچنین 
مواردی » تحلیل گر لغوی می تواند بجای اشاره گری به وارده جدول نماد ( یا یک اشاره 


گر به لغت تشکیل دهنده OT‏ نام ) فقط نام را به تجزیه کننده برگرداند . رکورد جدول 


نماد » هنگامی که ایجاد می شود که نقش نحوی این نام روشن گردد . برای اعلان های 


(۱- الف ) دو وارده در جدول نماد برای × ایجاد خواهد شد . یکی با × به عنوان یک عدد 
صحیح و دیگری به عنوان یک ساختار . 

صفات در پاسخ به اعلان ها که ممکن است ضمنی باشند » به جدول وارد می شوند . 
برچسب ها » اغلب شناسه هایی هستند که به دنبال آنها دو نقطه (:) قرار می گیرد » بنابراین 
پس از تشخیص چنین شناسه ای LL‏ اطلاع مربوط به بر چسب بودن آن را در وارده 
مربوط درجدول نماد وارد کرد . بطور مشابه » ساختار نحوی اعلان رویه ها مشخص می 


نماید که بعضی شناسه ها از نوع پارامترهای رسمی هستند . 


کارا کتر های موجود در یک نام 


بین نشانه 10 برای یک شناسه يا نام » لغت شامل رشته کاراکترهای تشکیل دهنده نام و 


صفات این نام تفاوت وجود دارد . بطور گسترده ای ممکن است با رشته هایی از 


کاراکترها کار نشود » بنابراین کامپایلر نمایشی با طول ابت از OT‏ نام را بجای لغت OF‏ 
استفاده می نماید . این لغت زمانی مورد نیازاست که وارده جدول نماد برای اولین بار وارد 
می شود . همچنین هنگامی که برای لغت CEL‏ شده در ورودی به جدول مراجعه می شود 
تا مشخص شود LT‏ این نام قبلا وجود داشته است یا خیر. نمایشی مرسوم از نام » اشاره 
گری است به وارد ه جدول نماد مربوط به آن . اگر حد بالای متوسطی برای طول نام 
وجود داشته باشد » کاراکترهای موجود در نام می توانند در وارده جدول نماد مشابه زیر 


ذخیره شوند : 


اگر محدودیتی برای طول نام وجود نداشته باشد یا اگر این حد بندرت قابل حصول باشد 


طرح pb‏ مستقیم شکل زیر می تواند استفاده شود : 


صفات نام 


بجای تخصیص حداکثر فضای ممکن برای نگهداری یک لغت در هر وارده جدول نماد 


اگر فقط فضا برای اشاره گری در وارد ه جدول نماد اختصاص داده شود » می تواند از 


فضا بطور کارآمدی استفاده نماید . در رکود یک نام > اشاره گری به آرایه ای از 


کاراکترها (جدول رشته ) قرار داده می شود که موقعیت اولین کاراکتر OT‏ لغت را 
مشخص می نماید . طرح غیر مستفیم اجازه می دهد اندازه فیلد نام وارده حدول نماد Cob‏ 


باقی بماند . 


برای هر نام » لغت کامل تشکیل دهنده OT‏ باید ذخیره شود تا اطمینان حاصل گردد که 
تمام کاربردهای OT‏ نام به یک رکورد از جدول نماد مرتبط می شوند . به هر حال 
رخدادهای Cal‏ مشابه که در محدوده های اعلان cle‏ متفاوت قرار دارند AL‏ قابل 


تفکیکت باشند : 


اطلاعات تخصیص حافظه 


اطلاعات مربوط به مکان cle‏ حافظه که در زمان اجرا به نام ها اختصاص خواهد یافت e‏ 


در جدول نماد نگهداری می شود . ابتدا نام هایی را با حافظه ایستا در نظر بگیرید . اگر کد 


هدف زبان اسمبلی باشد » اسمبلر این اجازه را خواهد داشت که در مورد مکان های 
حافظه برای نام cle‏ گوناگون » مر اقبت لازم را انجام دهد . تمام OT‏ چیزی که باید پس 
از تولید کد اسمبلی برای برنامه انجام گیرد » پویش جدول نماد و تولید تعاریف داده های 
زبان اسمبلی نامی می باشد که AL‏ به برنامه اضافه شود . 

اگر کد ماشین را کامپایلر باید تولید کند موقعیت هر داده مقصود نسبت به یک مبدا ثابت 
مانند ابتدای یک رکورد فعالیت » باید مشخص شود . توضیحات مشابهی در مورد یک 
oh‏ ک ازداده ها که به عنوان یک پیمانه مجزا از برنامه بار می شود » می تواند بکار رود. 
برای مثال بلو ک های COMMON‏ در فرتن به صورت مجزا بار می شوند و موقعیت نام 
ها نسبت به ابتدای بلو COMMONES‏ در فرترن به صورت مجزا بار می شوند و موقعیت 


نام ها نسبت به ابتدای بلو COMMON ES‏ در آن قرار دارند » LL‏ مشخص شود . 


در رابطه با نام هایی که حافظه آنها در پشته یا کپه اختصاص يافته » به هیچ وجه کامپایلر 
حافظه را اختصاص نمی دهد . 

ساختمان داده لیست برای جدول های نماد 

ساده ترین ساختمان داده برای ساخت جدول نماد » لیست خطی از رکورد ها می باشد » 


که در شکل زير نشان داده شده است : 


available 


از یک آرایه یا چندین آرایه معادل » برای ذخیره نام ها و اطلاعات مرتبط با آنها استفاده 


می شود . نام های جدید به همان تر تیی که COL‏ می شوند » به لیست اضافه می گردند 


موقعیت انتهای آرایه با اشاره گر available‏ علامت گذاری می شود » که به محلی اشاره 
می کند که وارده بعدی باید در جدول نماد قرار گیرد . جستجو برای نام از انتهای آرایه 


تا ابتدا به صورت معکوس انجام می گیرد . هنگامی که نام مورد نظر یافت شود » اطلاعات 


مرتبط با آن می تواند در کلمات بعد ازآن Cal‏ شود . اگر بدون یافتن نام به ابتای آرایه 
پرسد » خطایی رخ می دهد مبنی براینکه نام مورد نظر در جدول وجود ندارد . 

توجه داشته باشید که ایجاد یک وارده برای نام و یافتن نام در جدول نماد » عملیات 
مستقلی هستند » یعنی می توان یکی ازآنها را بدون دیگری انجام داد. در زبانی با ساختار 
بلو کی » رخدادی از نام در محدوده نزدیکترین اعلان متداخل OT‏ نام است . این قانون 
محدوده را می توان با استفاده از ساختمان داده لیست و با ایجاد یک وارده جدیدی برای 
نام » هر زمانی که اعلان می شود پیاده سازی کرد . وارده جدید در GLAS‏ بلافاصله بعد 
از اشاره گرد available‏ قرار داده می شود و این اشاره گر به مقدار اندازه رکود جدول 
نماد افزايش می یابد . چون ورودی ها با شروع از ابتدای آرایه به ترتیب درج می شوند » 
آنها به ترتیبی که اعلان شده اند قرار دارند . با جستجو ازمحل available‏ و حرکت به 
سمت ابتدای آرایه » مطمئن خواهیم بود که جدیدترین وارده ایجاد شده را خواهیم یافت . 


اگر جدول نماد داری ٥‏ نام باشد » میزان کار لازم برای درج کردن یک نام جدید ثابت 


خواهد بود چنانچه بررسی برای وجود OT‏ نام از قبل در جدول انجام نگیرد . اگر چندین 


ورودی برای نام ها مجاز نباشد » برای مشخص شدن عدم وجود نام در جدول » تمام 
جدول باید جستجو شود » در این فرایند Ol jee‏ کار انجام شده متناسب با 9 است . به منظور 
یافتن داده cle‏ مربوط به یک نام » به طور متوسط 9/2 از نام ها بايد جستجو شود » 


بنابراین هزینه درخواست نیز متناسب با 10 است . به این ترتیب با توجه به اينکه درج کردن 


و درخواست » زمانی متناسب با 0 نیاز دارند »کل کار انجام شده برای درج کردن 2 نام و 
انجام 6 درخواست حدا کثر  cn(nte)‏ باشد که 6 ابتی است نشان دهنده زمان لازم 
برای انجام چند دستور زبان ماشین . در یک برنامه با اندازه متوسط » ممکن است 21000 
و9100 بنابراین چند صد هزار دستور ماشین در فرایند نگهداری اطلاعات صرف می 
شود . این مقدار همکن cial‏ نگران کننده نباشد ‏ زیرا در مورد زمان کمتر از یک انه 
صحبت می شود . درهر صورت ‏ اگر 6 و 9 در 10 ضرب شوند » هزینه در 100 ضرب 
خواهد شد . و زمان نگهداری اطلاعات عاملی باز دارنده خواهد بود . محاسبه زمان اجرا 
اطلاعات زیادی را در رابطه با اینکه کامپایلر زمان را در کجا صرف می نماید ‏ در اختیار 
قرار می دهد و می تواند به منظور تشخیص اینکه LT‏ زمان بیش از حد برای جستجو 
درلیست های خطی تلف می شود استفاده گردد . 


جداول درهم 


روش متفاوتی در جستجو به نام جستجوی در هم در بسیاری از کامپایلرها بکار گرفته شده 


است . در اینجا حالت osle‏ ای به نام درهم باز بررسی می گردد که ‹ باز » اشاره به این 
ویژگی دارد که محدودیتی برای تعداد ورودی هایی که می توانند در جدول قرار گیرند 
وجود ندارد . حتی این طرح نیز قابلیت انجام 6 درخواست با pln‏ را در زمانی متناسب با 
n(nte)/m‏ با هر ثابت دلخواه 10 را فراهم می سازد . با توجه به این که ۳ می تواند به هر 


اندازه دلخواه بز رگ باشد » حداکثر تا این روش بسیار کاراتر از لیست های خطی است 


و روش انتخاب شده ساخت جداول نماد در اکثر موارد است . همانطور که انتظار می رود 
فضای اشغال شده توسط این ساختمان داده » با m‏ افزایش می HE‏ » بنابراین تعادلی بین 


زمان وفضا slow!‏ شده است . طرح اصلی جستجوی در هم در شکل زیر نمایش داده شده 


آرایه ليست عناوین که با مقدار درهم 


سازمان دهی شده است 


لیست عناوین ایجاد نشده برای 


نام های osla Olas‏ شده 


n 


action 


این ساختمان داده دارای دو بخش است : 


۱-جدول در هم شامل آرایه ثابت با ۳ اشاره گر به وارده های جدول . 


۲- ورودی های جدول به صورت M‏ لیست پیوندی مجزا به نام 5 سازمان دهی 
شده اند (بعضی از buckets‏ ها ممکن است خالی باشند ) . هر رکورد جدول نماد دقیقا در 


یکی از این لیست ها ظاهر می شود . حافظه برای ر کوردها می تواند از آرایه ای از ر کورد 


ها داده شود » همانطور که در بخش بعد بحث شده است . از طرف دیگر امکانات 
تخصیص حافظه پویای زبان پیاده سازی کننده » می تواند برای گرفتن فضابرای رکوردها 
استفاده شود 6 و اغلب با کاهش کارایی همراه است . 

به منظور تشخیص وجود یک وارده در جدول نماد برای رشته ۰5 یک تابع در هم از ah‏ 
5 استفاده می شود که(9)8 عدد بین 0 تا 10-1 را AGS‏ اگر و در جدول نماد 
وجود داشته باشد » در فهرستی با شماره h(s)‏ قرار دارد . اگر 5 هنوز در جدول وجود 
ندارد » با ایجاد یک رکورد برای 5 Ge‏ قرار دادن در جلوی فهرست شماره h(s)‏ به 
جدول اضافه می شود . 

با یک حساب سرانگشتی اگر ٩‏ نام » در جدولی با اندازه M‏ وجود داشته باشد ۰ بطور 
متوسط فهرست Seb chlo‏ برابر 02/00 ر کورد می باشد . با انتخاب am‏ شکلی که n/m‏ 
به یک ثابت SE ST‏ محدود شود .مثلا 2 ۰ زمان لازم برای دسترسی به یک ورودی از 
جدول ضرورتا ثابت است . 

فضای اشغال شده توسط جدول نماد شامل m‏ کلمه برای جدول درهم و cm‏ کلمه برای 


وارده Cle‏ جدول است که ٥‏ تعداد کلمات برای هر وارده جدول است . بنابراین فضای 


لازم برای جدول در هم فقط به 10 بستگی دارد » و فضای لازم برای وارده جدول » فقط به 


تعداد وارده ها واسته saal‏ 


انتخاب 4m‏ کاربرد مورد نظر برای جدول نماد وابسته است . با انتخاب مقدار چند صد 
برای mM‏ زمان مراجعه به جدول به اندازه کسری ناچیز از کل زمان مصرف شده توسط 
کامپایلر خواهد بود حتی برای برنامه هایی با اندازه متوسط. هنگامی که ورودی کامپایلر 
توسط برنامه دیگری تولید می شود » تعداد نام ها نسبت به اکثر برنامه cl‏ تولید شده 


توسط انسان با همان اندازه افزايش چشمگیری خواهد داشت . بنابراین جدول با اندازه 


ساد گی برای رشته هایی از کاراکترها قابل محاسبه باشد و رشته ها را بطور یکنواخت در 


میان 10 لیست توزیع نماید. یک روش مناسب برای محاسبه توابع در هم به صورت زیر 


۱- یک عددصحیح مثبت مانند ‏ از کاراترهای 0»....02,01 در رشته S‏ مشخص می 
گردد . تبدیل یک کاراکتر به عدد صحیح معمولا توسط Obj‏ پیاده سازی کننده پشتیبانی 
می گردد . پاسکال تابعی به نام ord‏ رابرای این منظور فراهم نموده است . 6 بطور خود 
کار یک کاراکتر را به عدد صحیح تبدیل می نماید اگر یک عمل محاسباتی بر روی آن 
انجام گیرد . 

ote -۲‏ صحیح h‏ که در مرحله قبل بدست آمده به شماره لیست تبدیل می گردد » یعنی 


عدد صحیحی بین 0 و 10-1 . فقط با تقسیم بر 17 و استفاده از باقیمانده OF‏ روشی معقول 


است . اگر m‏ عدد اول باشد » استفاده از باقیمانده به نظر بهتر عمل می کند بنابراین در 
جدول درهم مثال زده شده انتخاب 211 به cle‏ 200 انجام می شود . 

توابع در هم که به تمام کاراکترهای رشته توجه دارند » کمتر از توابعی که فقط به تعدادی 
از کارا کترهای انتها یا وسط رشته توجه دارند دچار خطا می شوند .بخاطر آورید ورودی 
به کامپایلر ممکن است توسط یک برنامه ایجاد شود و بنابراین به منظور جلوگیری از 
تناقض با نام cle‏ استفاده شده توسط اشخاص يا برنامه دیگر ممکن است دارای SSE‏ 
خاص باشند اشخاص تمایل به دسته بندی نام ها دارند مانند انتخاب های : 

. و مانند آن‎ bazl,new baz,baz 

یک روش cole‏ برای محاسبه ch‏ جمع نمودن مقادیر صحیح کاراکترهای رشته است . ايده 
نهتر » ضرب مقدار قبلی ۸ با ثابت 2 قبل از جمع با کارا کتر بعدی است . یعنی 

ho=0‏ , زر نطهحرط oly‏ >> ۸,1 = ۸ که )طول رشته است . (بخاطر آورید » مقدار 
درهم که شماره لیست را مشخص می نماید mod m‏ 1 است ) تنها جمع کاراکترها با 
یکدیگر » حالتی است که 2-1 می باشد . یک استراتغی مشابه این است که ci‏ ها Glow‏ 


جمع شدن با مقدار رب exclusive-or «a‏ شوند. 


برای altel‏ صحیح 32 بیتی » اگر 65599 = a‏ باشد »که یک عدد اول نزدیکک 21° است 


در این صورت بزودی در محاسبه hig‏ ۵ سر ریز رخ خواهد داد . با توجه به اينکه ۵ عدد 


در ER‏ سری آزمایش. تابع درهم hashpjw‏ در شکل زیر برای کامیایلر ٤‏ از 


P.J.Weinberger‏ با els‏ اندازه ها جدول امتحان شده به شکل مناسبی عمل می نماید. 


(1) #define PRIME 211 
(2) #define Eos ’ \0 ‘ 


(3) int hashpjw (s) 

(4) char *.s; 

(5) 1 

(6) char *p; 

(7) unsigned h= 0, g; 

(8) for (p =s; *p != Eos; p =p+1 ) 1 
(9) h=(h<<4) + (*p); 
(10) if ( g= h & Oxf0000000 ) { 
(11) h=h^(g>>24); 

(12) h= hg; 

(13) j 

(14) 3 

(15) return h % PRIME ; 

(16) } 


تابع نزدیک » تابعی بود که 1 را با ضرب مقدار قبلی OT‏ در 65599 و صرف نظر از سر 
ریز و جمع LOT‏ کاراکتر بعدی محاسبه نموده تابع hashpjw‏ با شروع از 13-0 محاسبه می 
شود. برای هر کاراکتر ٥‏ بیت های ‏ به اندازه 4 مکان به چپ انتقال می یابند و با ه جمع 


می شوند . اگر هر یک از 4 بیت مرتبه بالای 8 (۱) باشند این 4 بیت e‏ 24 مکان به راست 


انتقال داده می شود و با exclusive-or, h‏ می گردند و هر یک از چهار بیت مر تبه بالا 
که 1 بوده ‏ به صفر تبدیل می شود. 


مثال 1- الف به منظور رسیدن به بهترین نتایج ‏ اندازه جدول درهم و ورودی مورد 


مقادیر در هم برای نام Gb‏ که بطور مکرر در Obj‏ رخ می دهند متفاوت باشند اگر 
کلمات کلیدی نیز به جدول نماد وارد شوند » کلمات GAIT‏ نیز در گروه نام هایی هستند 
که بطور مکرر استفاده می شوند . اگر چه در یک نمونه از برنامه های ‏ نام أ تا پیش از سه 
بار » مشابه while‏ استفاده شده است . 

ER‏ راه امتحان نمودن تابع درهم تعیین تعداد رشته هایی است که در لیست مشابه قرار می 
گیرند . با داشتن یک فایل به نام ۴ شامل 9 رشته » فرض کنید تعداد bj‏ رشته در لیست j‏ 
قرار گیرند »برای ٣-1‏ > ز >0 یک اندازه گیری از ميزان یکنواختی رشته هایی که در 


لیست ها توزیع شده اند با محاسبه : 


m-1 


> bib; +12 
0-ز‎ 


بدست می آید . یک بازبینی استقرایی sly‏ این عبارت این است که براق GL‏ اولین 
وارده در لیست زنیاز بررسی یک عنصر ازلیست می باشد » برای GL‏ دومین عنصر ‏ دو 


b,.....92 91 (Bares‏ برابر با b(b;+1)/2‏ می باشد 


نمایش اطلاعات محدوده 


وارده cle‏ جدول نماد ؛ برای اعلان نام ها می باشند . هنگامی که برای رخدادی از نام » 


در جدول نماد جستجو می شود » وارده مربوط به اعلان مناسب OT‏ نام باید بر گردانده 
شود . قوانین محدوده در زبان مبدا مشخص می نمایند که کدام اعلان مناسب است . 

یک روش ساده استفاده از جدول نماد مجزا برای هر محدوده است . در نتبجه جدول نماد 
برای یک رویه یا محدوده Soles‏ رکورد فعالیت در زمان کامپایل است . اطلاعات غير 
محلی یک رویه با استفاده از پويش جدول cle‏ نماد مربوط به رویه های موجود در حیطه 
قوانین محدوده زبان یافت می شود . بطور مشابه اطلاعات محلی یک رویه می تواند به 
گروه مربوط به آن رویه در درخت نحو مربوط به آن برنامه الحاق گردد . با این گرایش » 
جدول نماد در نمایش میانی ورودی مجتمع می شود . 

اکثر قوانین محدوده که به شکل نزدیکی متداخل هستند » می توانند با اقتباس از ساختمان 
داده cle‏ ارائه شده در این بخش پیاده سازی گردند . نام cle‏ محلی هر رویه با اختصاص 
عدد منحصر به فردی به هر رویه قابل پیگیری است . اگر زبان دارای ساختار بلو کی است 
بل وک ها نیز باید شماره گذاری شوند . شماره هر رویه می تواند به صورت نح وگرا با 
استفاده از قوانین معنایی که ابتدا و انتهای هر رویه را مشخص می نمایند » محاسبه گردد. 
شماره رویه به عنوان بخشی از تمام اطلاعات محلی OT‏ رویه قرار می گیرد » نمایش نام 


محلی در جدول نماد زوجی است شامل نام و شماره رویه. (در بعضی از موارد مانند OT‏ 


هایی که در زیر توصیف شده اند ظاهر شدن شماره رویه به طور واقعی لزومی ندارد » زیرا 
می تواند ازموقعیت رکورد در جدول نماد مشخص شود ). 

هنگامی که برای نام تازه پویش شده به جدول نماد مراجعه می شود تنها هنگامی که 
انطباق رخ می دهد که کاراکترهای نام به صورت کاراکتر به کاراکتر با وارده منطبق 
گردد و شماره OT ol pod‏ در وارده جدول نماد با شماره رویه ای که در حال پردازش است 
برابر باشد. اکثر قوانین محدوده ای که بطور نزدیکی با هم متداخلند می توانند در قالب 
عبارت هایی از اعمال زیر بر روی یک نام پیاده سازی شوند : 

Lookup‏ : افتن جدیدترین وارده ایجاد شده 

1 ایجاد یک وارده جدید 

6 حذف جدیترین وارده ایجاد شده . 

وارده های حذف شده LL‏ نگهداری شوند » آنها فقط از جدول نماد فعال حذف می 
شوند در کامپایلر تک گذره » اطلاعات جدول نماد در مورد یک محدوده شامل بدنه 


رویه » پس از پایان پردازش بدنه رویه مورد GLE‏ نمی باشد . به هر حال ممکن است در 


زمان اجرا مورد نیاز باشد » مخصوصاً اگر یک سیستم تشخیصی زمان اجرا پیاده سازی 


شود . در این حالت » اطلاعات جدول نماد » باید به کد تولید شده برای استفاده الحاق گر 


یاسیستم تشخیصی زمان اجرا اضافه گردد . 


هر یک از ساختمان osla‏ های Cou‏ شده دراین بخش ‏ ليست ها و جداول در هم می 
توانند به شکلی به کار گرفته شوند که اعمال فوق را حمایت نمایند . 


هنگامی که لیست خطی شامل آرایه ای از رکورد ها در قسمت Gla‏ قبلی این بخش 


توصیف شد » به این نکته اشاره شده که چگونه Lookup‏ می تواند با درج کردن وارده ها 


در یک طرف به شکلی که ترتیب وارده ها در آرایه مشاره تر تیب درج کردن وارده ها 
باشد » oly‏ سازی شود . یک پویش با شروع از انتها و ادامه به سمت ابتدای آرایه » 
جدیترین وارده را برای oT‏ نام می یابد. این وضعیت شبیه ليست پیوندی شکل زیر 


می باشد : 


اشاره گر front‏ به جدیترین وارده اضافه شده به لیست اشاره می نمایند . پیاده سازی 
۲ زمان ابتی نیاز دارد زیرا وارده جدید در جلوی لیست قرار می گیرد . پیاده سازی 
Lookup‏ با پویش لیست و شروع از وارده اشاره شده توسط front‏ و Sis‏ نمودن اتصال 
ها تا زمان یافتن وارد o‏ مورد نظر یا فرارسیدن انتهای لیست ‏ انجام می گیرد . در شکل 
فوق وارده برای a‏ که By ES gh yo‏ اعلان شده است » که خود در داخل بل و Bo ES‏ قرار 


دارد » از وارده 2 که در BO‏ اعلان شده ‏ به ابتدای لیست نزدیکک تر است . 


cl,‏ عمل delete‏ توجه داشته باشید که وارده های مربوط به اعلان های رویه ای که در 
عمیق ترین رویه داخلی قرار دارند » در نزدیکك ترین قسمت به ابتدای لیست قرار می 
گیرند. بنابراین » نیازی به نگهداری شماره رویه با هر وارده نمی باشد . اگر اولین وارده 
برای هر رویه مشخص شود تمام وارده ها تا اولین وارده هنگامی که پردازش محدوده این 
رویه خاتمه می ابد » می تواند از جدول نماد فعال حذف گردد . جدول در هم شامل m‏ 


لیست ‏ با استفاده از آرایه دستیابی می شود . با توجه به اينکه یک نام همیشه با استفاده از 


al‏ درهم به لیست منتقل می شود هر یک از فهرست ها مشابه شکل فوق نگهداری می 


شود . به هر حال برای orl,‏ سازی عمل Gils delete‏ به پویش تمام جدول در هم برای 
یافتن لیستی شامل وارده هایی که AL‏ حذف شود نمی باشد . روش زیر می تواند مورد 
استفاده قرار گیرد .فرض LS‏ هر وارده دارای دو اتصال است : 

۱- یک اتصال در هم که این وارده را به وارده cle‏ دیگری که نام آنها توسط تابع در هم 
به مقدار مشابه تبدیل می شود به زنجیر متصل می نماید . 

۲- یک اتصال محدوده که تمام وارده هایی را که درمحدوده مشابه قرار دارند به صورت 
زنجیر به یکدیگر متصل می نماید . 

اگر اتصال محدوده در زمان حذف یک وارده از جدول در هم دست نخورده BL‏ بماند ؛ 
زنجیری که با اتصالات محدوده تشکیل شده است ‏ جدول نماد مجزایی را برای محدوده 


حذف وارده از جدول در هم باید با دقت انجام گیرد 6 زیرا حذف یک وارده بر مقدار 
قبلی OT‏ در فهرست SU‏ دارد . بخاطر آورید که حذف وارده شماره با برقراری ارتباط 


وارده شماره 1-1 با وارده شماره it]‏ انجام می گیرد بنابراین تنها استفاده از اتصالات 


محدوده برای یافتن وارد شماره ¡ کافی نیست . اگر اتصالات در هم یک لیست پیوندی 


حلقوی را تشیکل دهند که درآن آخرین وارده به اولین وارده اشاره نماید » وارده 1-1 ام 
نیز می تواند COL‏ شود . در مقابل می توان از پشته به منظور پی گیری تعیین لیست هایی 
شامل وارده هایی که باید حذف شوند استفاده نمود . هنگامی که رویه جدیدی پویش می 
شود » یک علامت در پشته قرار می گیرد . در بالای علامت » شماره لیست هایی شامل 
وارده هایی برای نام های اعلان شده در این رویه قرار دارند . هنگامی که پردازش این 
رویه خاتمه می LL‏ اعداد فهرست می توانند از پشته خارج شوند تا زمانی که علامت OT‏ 


رویه فرابرسد. 


